Главная Библиотека
Форум
Гостевая книга

Библиотека

Некоторые вопросы,
в которые я хотел бы
внести ясность

1. Зачем это всё делается?

Призыв с сайта "Зоометод".
Следуете ли вы ему?

Я не Робин Гуд, и я прекрасно понимаю, что только моими усилиями жизнь всех людей к лучшему не повернёшь - это надо делать всем миром. Но общее дело складывается из множества поступков отдельных людей. Можно сидеть, сложа руки, и ждать, пока оно всё само станет лучше. Но это долго. А можно начать что-то делать самому, и тогда ситуация будет хоть на волос, но сдвигаться с мёртвой точки. Как человек, получивший педагогическое образование и оставшийся в глубине души учителем, я создаю эту библиотеку для того, чтобы вернуть книги людям, а людей - к книгам. Я подбираю книги, которые могут быть интересными, но либо изданы давно, либо просто редкие сами по себе, либо заслуживают пристального внимания читателей (я преимущественно ориентируюсь на школьников и учителей естественных наук). Все книги в этой библиотеке представлены в полном виде, как они вышли из печати.

2. Какие книги собраны в этой библиотеке? Какие книги нужны?

Здесь я собираю книги естественно-научного направления. Преимущественно собраны книги, выпущенные в Советском Союзе, когда они проходили элементарное научное редактирование, и материалам, изложенным в них, можно было доверять. Современные книги, увы, зачастую не отвечают этим требованиям. В них могут написать что угодно, перевести как угодно плохо, и они всё равно выйдут в свет. На странице биоляпов я собрал образцы подобного книгоиздательского творчества (причём далеко не все, что видел! Иногда у меня не было возможности зафиксировать роскошные ляпсусы), но, боюсь, эта страница будет пополняться. Часто это бывают книги, хорошо изданные на дорогой бумаге, с цветной печатью, за большие деньги. Но содержание - абсолютно никчёмное из-за ошибок.
Книги, которые размещены в библиотеке сайта, большей частью не такие. Чёрно-белые рисунки, сероватая бумага, почтенный возраст (некоторые из них намного старше меня самого), отчасти устаревшее с научной и политической точки зрения содержание... С некоторыми из них было трудно работать из-за их ветхости или хрупкости проклеенных блоков. Но они были написаны или редактировались специалистами, и тому, что в них написано, можно доверять. В них нет нездоровой сенсационности жёлтой прессы, которая в наши дни просачивается в литературу. А правда оказывается ещё более захватывающей, нежели изощрённый вымысел невежественных газетчиков.
В большинстве случаев я не помещаю в библиотеку сайта книги с большим количеством цветных иллюстраций - такие, как выходили в издательстве "Мир", например. Они могут быть интересны, но их размер очень велик из-за обилия рисунков, и мне чисто технически сложно сбрасывать их на сайт. Исключением стали только книги Дугала Диксона. В остальных случаях я отдаю предпочтение книгам, которые нужно читать, а не разглядывать, поскольку в чтении вижу гораздо большую пользу.
Первые книги, попавшие в библиотеку сайта, были взяты из моей собственной библиотеки. Далее копии нескольких книг мне прислали по Интернету, и несколько книг дали для сканирования родственники и знакомые, за что им всем огромное спасибо.
Какова тематика библиотеки сайта?

3. Почему вы делаете книги в формате HTML?

Когда я делал свои первые книги, у меня были под руками книга, сканер и программа для создания HTML-файлов. Большего, собственно, и не требуется. Тогда я просто не знал, как делать PDF-файлы и файлы других форматов, и потому обрабатывал свои книги так, как мог.
Один раз я попробовал сделать книгу в формате PDF, но отказался от него по многим причинам. У меня нет специального редактора для PDF-файлов, и я делал его стандартными средствами программного обеспечения к сканеру. Возможно, моё мнение сложилось именно из-за этого, но я убедился, что с этим форматом очень неудобно работать.

  1. Чтобы скорректировать ошибку в распознанном тексте, нужно обрабатывать сканированный разворот в графическом редакторе. В формате HTML достаточно просто поправить букву на нужную. Работа с файлами PDF отнимает, таким образом, много времени.
  2. Файлы PDF получаются очень большими. У меня пока ещё dial-up, и сбрасывать их на сайт очень сложно.
  3. Файлы PDF не читаются поисковыми машинами, и возможности пользователей Интернета по поиску информации в данном случае ограничены.

Ещё один формат, DjVU (ДеЖаВЮ), даёт в итоге рисунки сканов страниц в формате TIF с большим разрешением. В этом случае получается полный аналог страниц оригинального издания, но для работы с файлами (например, чтобы вставить цитату в какую-то работу, реферат и пр.) нужно распознавать текст с помощью специальных программ, или перепечатывать его от руки. Формат также отличается громоздкими исходными файлами.

4. У меня есть книга, которая может вас заинтересовать. Я хочу поделиться ею. Как это сделать?

Это сделать не только можно, но и нужно. Несколько книг в библиотеке сайта были присланы мне хорошими людьми, и со временем они появляются на сайте, когда приходит их очередь.
В первую очередь нужно просто спросить, подходит ли эта книга для библиотеки сайта. Если подходит, то тогда наступает время поговорить о её оцифровке.
Моя задача - максимально точно сохранить оформление оцифрованной книги, для чего я предпочитаю видеть перед собой рисунки страниц. Поэтому самый приемлемый способ - переслать книгу в виде сканированных страниц в архивах. Единственной проблемой пока является мой dial-up, который с трудом "глотает" очень большие файлы. Поэтому лучше будет, если книга будет заархивирована кусками по 2 - 3 мегабайта. Сканировать надо с умом, и всеми силами добиваться того, чтобы сканы "весили" как можно меньше. Поэтому следует по-разному относиться к таким элементам книги, как текст, чёрно-белые графические рисунки и цветные рисунки. Поэтому далее я подробнее остановлюсь на этих вопросах.

Текст.
Это самое основное в книге. Для распознания текста я использую программу FineReader, а она требует для хорошей работы разрешения 300 пикселей на дюйм (dpi), поэтому сканы, содержащие текст, нужно делать при таком разрешении в режиме grayscale (градации серого). Лучше каким-то образом отрегулировать контрастность, хотя, в принципе, я и сам неплохо работаю в Photoshop.

Чёрно-белые графические рисунки.
В готовой книге я предпочитаю для их отображения формат GIF с прозрачным фоном. Опыт показывает, что рисунки такого рода лучше делать в режиме grayscale при разрешении 200 dpi. Тогда эти рисунки почти не теряют своего качества и детализации. Если вы сканируете страницу, на которой есть и рисунок такого рода, и текст, то можно ради уменьшения размера пересылаемого файла просто отсканировать на странице при 300 dpi только текстовую часть, а рисунок с кусочком текста (чтобы было ясно, где он находится) сделать при разрешении 200 dpi. Рисунок получается крупным, и я уменьшаю лишь его видимый размер на странице. Благодаря формату GIF он "весит" немного.

Цветные рисунки.
В оцифрованной книге цветные и чёрно-белые неграфические рисунки и фотографии имеют разрешение 100 dpi. Соответственно, вряд ли стоит делать их с более высоким разрешением. Если рисунки будут сделаны с небольшим запасом по краям - ничего страшного. Это лучше, чем если часть рисунка будет срезана.

Вариант присланного текста: документ Word
Это лучше, чем сканы страниц, поскольку занимает намного меньше места, однако, создаёт ряд дополнительных требований. В данном случае вся ответственность за точность распознания текста ложится на присылающего. Также непременным требованием является сохранение оформления текста - курсив, жирный и мелкий шрифт, где они есть, должны присутствовать в документе Word, чтобы можно было при вёрстке текста сохранить его исходное оформление. Также следует указать местоположение рисунков в книге и их выравнивание - по левому, правому краю, или по центру. Рисунки при конвертировании в Word не всегда сохраняются (есть опыт с получением подобной книги), и должны быть сделаны отдельно. Иными словами, с этим вариантом также много работы.

В любом из вариантов необходим сканированный рисунок обложки книги шириной не менее 450 пиксел. Если на обложке есть какие-то повреждения или загрязнения, это не пролема - я часто устранял их с помощью Photoshop. Если они сильные и другого рисунка негде взять, то пусть уж останется так, как есть.

В идеальном варианте, конечно, я предпочёл бы получить уже оцифрованную и свёрстанную в HTML книгу, но это слишком эстетично и вряд ли кто-то решится на это. Пока таких книг не было, но кто знает?

5. Какие книги однозначно не появятся в библиотеке сайта?

Религиозно-агитационная и псевдонаучная литература типа мулдашевщины, хаббардовщины, всяких "Сторожевых башен" и прочей шелухи. Им место только на препаровальном столе.

6. Сколько вы платите за работу по оцифровке книг?

Нисколько. Попробуйте быть хорошими и добрыми просто так.


В Интернете существует немало других библиотек сходной тематики, ещё более полных и подробных, чем существующая на этом сайте. Например, есть библиотека сайта "Зоометод" - она находится здесь.

Есть вопрос, который не раскрыт здесь? Пишите!

Главная Библиотека
Форум
Гостевая книга

 

Hosted by uCoz