хм. у меня когда-то бродила идея lib.ru сконвертировать в XML. и отдавать налету желающим. Впрочем, Мошков ясно пишет у себя, что он против изменения формата - ему все и так нравится. ;)
А я тогда еще совсем баловался - я свой DTD сделал, развивавшийся по мере "отркытия" новых фишек. Я как-то так подумал, что все они друг в друга переводятся примитивно. Но все уткнулось, естественно, в отсутствие информации. Если я правильно помню, у Мошкова в "стандартном" формате нельзя даже отличить заголовок книги от названия главы.
На счет конвертации между DTD. Это не всегда так - разлчные DTD могут работать с совсем разными семантическими структурами текста. Одно DTD может, например, разбивать на параграфы, а другое - описывать чтение текста. Конвертация между ними будет нетривиальной.
У Мошкова страндартный "формат" вообще не разделает представление и структуру.
А вот такой вопрос, если рассматривать DTD для библиотеки, если ли уже что-то готовое, что бы не изобретать велосипед? Вроде у проекта Гутенберг было что-то, но я сходу не нашел. DocBook мне кажется неподходящим. TEI? Это надо Бориса спросить.
Ну, естественно, я разбивал в том же ключе, что и TEI - книга, глава, автор, эпиграф и т.д. :) TEI мне тоже больше всех понравился - единственное "но" - надо все же убедиться, что с тех пор не появилось ничего нового, "принятого повсеместно". Т.е. формат-то хорош, но хочется, чтобы он не был совсем уж белой вороной.
no subject
no subject
no subject
no subject
Но все уткнулось, естественно, в отсутствие информации. Если я правильно помню, у Мошкова в "стандартном" формате нельзя даже отличить заголовок книги от названия главы.
no subject
У Мошкова страндартный "формат" вообще не разделает представление и структуру.
А вот такой вопрос, если рассматривать DTD для библиотеки, если ли уже что-то готовое, что бы не изобретать велосипед? Вроде у проекта Гутенберг было что-то, но я сходу не нашел. DocBook мне кажется неподходящим. TEI? Это надо Бориса спросить.
no subject
no subject
no subject
no subject
no subject
(Кста, у меня на TEI Lite прикопан перевод документации).
no subject