Опыт создания электронных версий периодических изданий
А. Цицин, В. Меркулов, С. Самойленко, Термика
При современном уровне развития информационных технологий использование компьютера для
хранения любых видов информации становится единственным способом, предоставляющим
широчайшие возможности по управлению информацией.
Кому в первую очередь нужна электронная версия периодического издания?
- Во-первых, она жизненно необходима редакционному коллективу.
- Во-вторых, она необходима специалистам, занимающимся аналитической работой в
данной предметной области.
- В-третьих, она нужна читателям, получающим доступ ко всему архиву данного издания
и возможность опережающего, по сравнению с печатным изданием, получения очередного
номера газеты или журнала.
Технология выпуска печатных изданий в каждой редакции имеет свои особенности. Но единой
для всех является проблема хранения различного рода информации, как графической, так и
текстовой. Как правило редакция пытается справиться с большими объемами информации при
помощи архивирования, причем практически неупорядоченного. При этом очень трудоемким
является выборка статей на определенную тему, назначение ссылок на предыдущие статьи и т.д.
Эти факторы влияют на общую производительность редакции из-за трудностей поиска и
выборки предыдущих статей. Для бумажного варианта подшивки периодического издания
поиск по тематике или контексту абсолютно неприменим, причем каждый раз приходится рыться
в поисках нужной статьи, а для поиска всех статей одного автора придется просмотреть все
страницы номеров.
База данных, содержащая всю информацию из подшивки будет без проблем выполнять любой из
этих поисков в совокупности с множеством других. Несомненно, что необходимо будет потратить
время для перевода всей уже имеющейся информации в базу данных или, при отсутствии каких-
либо архивов в электронном виде, применить технологии распознавания образов для
преобразования текстов в электронный вид. Но не надо забывать, что базу данных
впоследствии придётся наполнять поступающей информацией, а это значит, что придется
преобразовать и порядок оборота документов в редакции.
Так как практически в любой редакции каждый ответственный редактор отвечает за ведение
своей рубрики, то погрешности при её ведении проще всего выявить, используя эффективные
возможности специализированных систем обработки и хранения информации. При помощи
таких инструментов как поиск по тексту, приблизительный поиск, поиск по атрибутам статьи
(номер статьи, дата выхода в печать, дата подписания в печать, номер печатного издания и
т.д.), статьи могут быть отсортированы по любому атрибуту, при этом заметно упрощается и
упорядочивается обработка и хранение статей и графических элементов, создается возможность
улучшить положение с ссылками в печатном издании, при этом статистически можно определить
продуктивность того или иного автора за определенный период времени.
Очень положительно сказалось бы применение технологии электронного документооборота для
всей группы верстальщиков, когда сверстанные полосы в своей окончательной,
отредактированной версии передавались бы по локальной вычислительной сети к сотруднику
редакции, занимающемуся преобразованием полос из формата системы верстки в другие, широко
распространенные форматы (например, формат Microsoft Word) с их последующим вводом базу
данных. Такая работа по преобразованию содержит в себе немало трудностей, так как
непосредственного перевода из одного формата в другой не может быть без дополнительных
затрат времени на разработку средств автоматического преобразования - макросов. Но и это не
решает всех проблем по преобразованию таблиц в текстовую форму, как единственную
приемлемую для проведения контекстного поиска, которые в системах вёрстки чаще всего
представляют из себя сложную графическую конструкцию. Преобразованию статей необходимо
уделять очень много внимания, так как при этом возможны потери отдельных частей статьи, не
являющихся единым целым с основным текстом, например, врезок, сносок и т.д.
При помощи развитых инструментальных средств поиска в базе данных существует возможность
выявления погрешностей и несоответствий в статьях, рубриках, графических материалах,
удобно хранящихся непосредственно с текстом статей, что облегчает поиск необходимой
картинки. Система обработки информации может быть использована и в сетевом режиме. В
таком случае возможно совместное ведение электронной версии издания в масштабах всей
редакции, причем актуализированная информация всегда доступна всем членам редакции. При
ведении электронной версии издания попутно вводится ещё одна ступень проверки статей на
наличие орфографических ошибок, пропусков статей и других чисто технических ошибок,
проверка на содержание в словах русского словаря букв английского алфавита, и наоборот, что
позволяет собрать статистику работы корректорской группы. Таким образом, гармонично
внедрив новые возможности специализированной системы по упорядочению информационного
материала в уже существующую технологию, устоявшуюся в редакции, можно получить
значительное повышение производительности труда отдельного взятого сотрудника редакции.
Актуальность электронной версии опережает как правило само печатное издание, так как
новый номер издания поступает в систему до реального выхода печатного издания.
Для организации баз данных электронной версии периодического издания возможно
применение, в принципе любой СУБД, но мы рекомендуем информационную систему "КОДЕКС"
версии 4.1, обладающую рядом преимуществ для создания электронных версий периодических
изданий, которых нет у других универсальных СУБД. Версия 4.1 ИПС "КОДЕКС" содержит
средства для разработки и поддержки баз данных произвольной структуры с наполнением
текстом со стандартными возможностями форматирования (выравнивание, выделение разными
стилями шрифта), графическими вставками в формате BMP, а также возможностью вставки
текста в виде таблиц. Это позволяет сделать электронную версию издания полноценно
иллюстрированной.
Уникальной возможностью для ИПС "КОДЕКС" версии 4.1 является хорошо разработанная
система поддержания актуальности базы данных путем генерации и распространения любым из
доступных способов - почтой на магнитных носителях, электронной почтой, через FTP-сервера
Internet и т.д. - пакетов обновления, небольших по сравнению с размером самой базы данных
файлов, содержащих описание изменений в базе данных вплоть до любых серьезных
преобразований структуры. Если говорить о наполнении базы данных, то ИПС "КОДЕКС"
позволяет делать любые операции над базой данных по локальной сети нескольким
пользователям одновременно. Перенос материалов из системы верстки в ИПС "КОДЕКС" может
осуществляться непосредственно через стандартное Windows-средство (clipboard), или через
промежуточный перевод в формат Microsoft Word. Материал, внесенный в базу данных ИПС
"КОДЕКС" автоматически получает все встроенные мощные средства поиска по контексту и по
любым полям статей. В процессе разработки структуры будущей базы данных следует особо
уделять внимание совместимости по структуре с другими базами, которая позволяет
использовать Вашу базу данных одновременно с другими базами данных. Это дает помимо
просто удобства (одна оболочка - много баз данных) возможность проведения сквозных поисков
по произвольным наборам баз данных, причем для всех периодических изданий возможна
разработка единой универсальной структуры, что позволило бы объединить данные из одного
журнала с другим, например узнавать, что написано в нескольких изданиях по конкретной
тематике, организовав поиск по тематике или контексту.
Сочетание электронных версий различных печатных изданий в ИПС "КОДЕКС" версии 4.1
образует единое информационное пространство для поиска и хранения информации, причем с
возможностью перекрестных ссылок между разными базами данных, например, статьи
электронной версии одного печатного издания могут ссылаться на статьи в другом издании и
т.д.
[]
[]
[]