хм. у меня когда-то бродила идея lib.ru сконвертировать в XML. и отдавать налету желающим. Впрочем, Мошков ясно пишет у себя, что он против изменения формата - ему все и так нравится. ;)
А я тогда еще совсем баловался - я свой DTD сделал, развивавшийся по мере "отркытия" новых фишек. Я как-то так подумал, что все они друг в друга переводятся примитивно. Но все уткнулось, естественно, в отсутствие информации. Если я правильно помню, у Мошкова в "стандартном" формате нельзя даже отличить заголовок книги от названия главы.
На счет конвертации между DTD. Это не всегда так - разлчные DTD могут работать с совсем разными семантическими структурами текста. Одно DTD может, например, разбивать на параграфы, а другое - описывать чтение текста. Конвертация между ними будет нетривиальной.
У Мошкова страндартный "формат" вообще не разделает представление и структуру.
А вот такой вопрос, если рассматривать DTD для библиотеки, если ли уже что-то готовое, что бы не изобретать велосипед? Вроде у проекта Гутенберг было что-то, но я сходу не нашел. DocBook мне кажется неподходящим. TEI? Это надо Бориса спросить.
Ну, естественно, я разбивал в том же ключе, что и TEI - книга, глава, автор, эпиграф и т.д. :) TEI мне тоже больше всех понравился - единственное "но" - надо все же убедиться, что с тех пор не появилось ничего нового, "принятого повсеместно". Т.е. формат-то хорош, но хочется, чтобы он не был совсем уж белой вороной.
no subject
Date: 2003-10-27 01:46 am (UTC)no subject
Date: 2003-10-27 02:42 am (UTC)no subject
Date: 2003-10-27 03:07 am (UTC)no subject
Date: 2003-10-28 12:16 am (UTC)Но все уткнулось, естественно, в отсутствие информации. Если я правильно помню, у Мошкова в "стандартном" формате нельзя даже отличить заголовок книги от названия главы.
no subject
Date: 2003-10-28 01:03 am (UTC)У Мошкова страндартный "формат" вообще не разделает представление и структуру.
А вот такой вопрос, если рассматривать DTD для библиотеки, если ли уже что-то готовое, что бы не изобретать велосипед? Вроде у проекта Гутенберг было что-то, но я сходу не нашел. DocBook мне кажется неподходящим. TEI? Это надо Бориса спросить.
no subject
Date: 2003-10-28 02:09 am (UTC)no subject
Date: 2003-10-28 02:21 am (UTC)no subject
Date: 2003-10-28 03:02 am (UTC)no subject
Date: 2003-10-28 03:04 am (UTC)no subject
Date: 2003-10-28 03:08 am (UTC)(Кста, у меня на TEI Lite прикопан перевод документации).
no subject
Date: 2003-10-28 05:04 am (UTC)