Здравствуйте! Спасибо большое за все ваши работы! Скажите пожалуйста у вас случайно нет возможности сделать оцифровку след. словарей : 1) "Словарь русско- украинский" в 3томах 2го или 3го издания вот такой https://www.olx.ua/d/obyavlenie/slovar-russko-ukrainskiy-3t-IDJDUCc.html?reason=observed_ad или 2е изд https://www.olx.ua/d/obyavlenie/russko-ukrainskiy-slovar-IDLWoQS.html?reason=observed_ad 2) Словник іншомовних слів випущений в 1985 за редакцією академіка АН УРСР О. С. Мельничука. вот такой https://www.olx.ua/d/obyavlenie/slovnik-nshomovnih-slv-za-redaktsyu-o-s-melnichuka-IDMgRGP.html?reason=observed_ad 3) "Короткий тлумачний словник української мови". 1988г Гринчишина 4) 5-я книга Білодід І. К. (ред.) Сучасна українська літературна мова. Стилістика ибо та что тут как видно не очень качественно оцифрована /file/1039107/ 5) может есть другие какие укр словари советского периода с 1980 до распада (которых нет оцифрованными) ?С уважением, Игорь
Здравствуйте.Короче - к сожалению нет. Я занимаюсь болгарским, немецким и русским, соответственно словари оцифровываю в основном с этих трех языков (и несколько многоязычные). Все остальное я нашел где-то в интернете, посчитал ценным или редким и загрузил сюда. Иногда качество улучшаю, насколько умею и насколько это возможно, или просто распознаю текст, но все равно словари на бумаге на других языках кроме болгарский, немецкий и русский для оцифровки у меня нет. В общем, сейчас работаю над последним бумажным словарём, который у меня есть (здесь выложен не будет, так как будет заблокирован).
Понял. А "Словарь русско- украинский" Белодеда в 3х томах 2го или 3го версий, он же вроде как на половину русский и по идее подходит вашим критериям или нет ? Я говорю про последнее издание 80х годов вот то что по ссылкам чуть ниже а не те 60х которые в инете уже есть https://www.olx.ua/d/obyavlenie/slovar-russko-ukrainskiy-3t-IDJDUCc.html?reason=observed_ad или 2е изд https://www.olx.ua/d/obyavlenie/russko-ukrainskiy-slovar-IDLWoQS.html?reason=observed_ad
Нет, к сожалению тоже нет. Если был бы немецко-русский, русско-немецкий или в порядке исключения русско-русский, тогда может быть, но украинский язык не представляет для меня особый интерес...
Речника на литературните термини го имам, само че и през ум не ми е минавало да го сканирам - не помня откога не ми е трябвал за нещо, а има още цял куп за сканиране, само дето време няма... Иначе подлежи на сканиране, че и по две страници наведнъж, но все пак е 1112 страници - следващото издание след това от линка, от 1973 година. Може да го започна, но не давам срокове кога ще стане, зависи от много неща.Останалите ги нямам - просто не са ми потрябвали, иначе за речници пари и усилия не жаля. Общо взето, в посока български-български съм сканирал почти всичко, с което разполагам.Това, което остава: Речник на чуждите думи на БАН - безнадеждно остарял, качил съм няколко варианта на други издателства, плюс този, сниман с фотоапарат от Игор Маханков; за Речника на литературните термини казах; "Жаргонът, без който (не) можем" - 102 страници, от 1989 г.; Речник на българската граматична терминология, част I (част II май така и никога не е излизала) - от А до Я е, какво е трябвало да има във втората част, нямам идея; 208 страници; Речник на нови и най-нови думи в българския език от 1995 г., 188 страници; Речник на словосъчетанията в българския език - 199 страници, от 1993 г. Ако някой от тези малките Ви върши работа, мога да се напъна да го сканирам вечер, за два-три дни би трябвало да стане. За големия на литературните термини... не знам. Бях планирал друго.В папката ми, която Ви пратих, има Речник на непознатите думи в българската литературна класика - това, предполагам, ще Ви върши работа.
Скачал Duden: Das große deutsche Wörterbuch, Band 1, хорошее качество обработки сканов. Сам старый сканировщик, более 500 т. сканов имел. Не советую FR выше 8 легендарной версии, все после только 1) разваливают набор по размеру шрифта на страницe и 2) типу шрифта. Смотрите сканы от Google - там 8-ка в 99,99%. Можно ли установить контакт с Вами по е-маил? - Вам будет полезно, напишу насчет FR, дам ссылку. Уверен, лучшие сканы еще впереди.
Здравствуйте.Да, конечно, но с Duden-ом история несколько сложнее - я нашел сканы в формате jpg, "склеил", потом кто-то распознал и сконвертировал в DJVU и выложил уже распознанную книгу, т.е. не работу сделал не я. Рассмотрите последние выложены мной файлы - там есть много, которые сделал я сам от начало до конца или скачал, распознал и потом опять выложил. С сентября распознал и выложил много из старых книг, которые я отсканировал или нашел прошлом летом. Работаю с FineReader 12 или FineReader 14, и, думаю, один или два раза - с ORPALIS PDF OCR Professional. В наличности есть и FineReader 7.0 Scripting Edition with FineReader XIX, но так пользуюсь программой и для работу, думаю, не буду деинсталлировать 12 или 14. Но, полагаю, они смогут сожителствовать вместе. Иначе буду рад: snsdg@mail.ru.Спасибо заранее!
Не советую FR выше 8 легендарной версии, все после только 1) разваливают набор по размеру шрифта на страницe и 2) типу шрифта.
А мне кажется, версии после 12-й более эффективно используют библиотеки. Вначале я обратил внимание, что в выходных данных сокращение "усл." (печатных листов) перестало искажаться в "уел." А недавно, обрабатывая исходник с "ошибкой инь", пришедшей от пережатого djvu, заметил, что FineReader 15 весьма эффективно исправляет (не все, но довольно многие) ошибочные подмены и/н.+ И спасибо snsdgbg за слитки! Надеюсь, они не увлекут меня... ко дну... )
Здравствуйте.У меня версия 14 работает лучше, чем версия 15. Да, я согласен, что версии после 12-й более эффективно используют библиотеки, но иногда при некоторых книгах версии 14 и 15 в конце распознавания вылетают с ошибками, а 12 справляется на ура. Поэтому я ее держу. Что касается сравнению 14/15 - пожалуйста, сравните сами качество одной и той же книги. 1 распознал с помощью версии 15, 2 - через 14. Настройки приложениях идентичные:--В итоге 15-ую версию удалил и вернулся на 14-ую; 12-ая остается на компьютере.
В качестве распознавания (сверил выборочно по три страницы) различий не заметил. По степени сжатия результаты, конечно, существенно различаются. Такое впечатление, что файл (1) сохранен с dpi=150, а (2) - dpi=300. Соответственно, различаются и размеры файлов на ~17%. Если открыть файлы в редакторе (я пользуюсь PDF-Xchange), видно, что габариты изображений переднего слоя различаются в 3 раза (а в некоторых случаях - и в шесть!).Затем я закачал в FineReader 15.0 файл (2) в режиме использования наличного текстового слоя и повторно сохранил его, примерно, в тот же размер (dpi=300, сжатие 80). Качество заметно улучшилось - но зубцы бинаризации тем не менее остались. Предварительный вывод таков: в новой версии FineReader использован менее качественный режим сглаживания черно-белых символов. (Про цветные сказать ничего не могу, подожду, пока этим займутся другие, более сведущие люди.)Лично я не стремлюсь к аутентичному воспроизводству бумажных оригиналов, а ставлю на первое место наличие распознанного текстового слоя. Что позволяет индексировать электронную библиотеку и еще более делает ненужными бумажные.
Здравейте.Ровех се тук за нещо и попаднах на този стар разговор. Оттогава изтече много вода, та:https://cloud.freemdict.com/index.php/s/8PLtzHJweBqKqc9
Здравейте.Не, за съжаление, работя основно с немски и руски, останалото ми е между другото. Английският е извън интересите ми. От сканираните хартиени само това сираче тук: /file/2879826/Електронни: /file/2871150/ ; /file/2655187/ ; /file/2655174/ и /file/2655175/ ; още по друг начин след малко.
Спасибо Вам за словарь PONS. Das große Bildwörterbuch. Я хотел бы уточнить, в исходном файле также отсутствует около 300 страниц, начиная со страницы 541-581, после стр. 768 и вплоть до индекса?
Доброе утро, (я "жаворонок" и очень рано встаю). Спасибо за подарок и ссылки. Я, когда увидел ваши ссылки на мейл.ру, у меня , как говорят, прокакатилась слеза по суровому мужскому лицу. Я ведь живу в Украине, даже больше скажу - в Ровенской области. У меня был и ящик на мейл .ру, я оттуда почти не вылазил из социальной сети . Но... Сейчас а Украине сайты типа В контакте, мейл ру заблокированы. Вот такие дела. Эти запреты я не приветствую.
Скажите, пожалуйста, какой программой вы конвертируете книги с pdf в djvu-формат? Книги у вас хорошие и по части содержания, и по части качества ( сканирования). Большое спасибо!
Здравствуйте.Некоторые из них нашел так - уже сконвертированные в DJVU (кто-то взял то, что я скомпилировал, и потом сконвертировал), а часть из них сконвертировал через https://pdf2djvu.com/ . В общем-то, результат не особо задоволителен. Большинство книг после конвертирования имеют невысокое качество. Вчера позанимался, и несколько файлов сжал с 1,5-1,7 GB до несколько сотен мегабайт.
Ещё раз спасибо, я сканирую через программу Файн ридер, сканы получаются отличные , но потом, когда сохраняешь в pdf формате Файн ридер просто издевается — книга получается размазаной. Говорят, нужны последние версии Файн ридера, где-то в районе 10—14 версии. Есть программа Сalibre, но она не всегда конвертирует в djvu, для неё нужен, я так понял, слой OSR.
Посмотрели и ваши посты. Я уже их когда-то смотрел: что-то подзабыл, что-то всомнил. Или в меня дежавю, как говорят, в психологии. Но все равно методы не универсальные. Можно и так, и сяк. Мы почему-то зацыклены или не pdf, или djvu форматах. Книги с большим количеством страниц ( больше 1000 страниц) в этих форматах выходят до 300 mb. Осканировал немецко-русский словарь К. Лейна, в котором 95 тыс. слов. Сканы словаря вставил в вордовский документ, страницы вышли черно-белые, но качество намно лучше, чем в pdf. Правда, файл вышел большой , разместить на сайте пока не получается: слабый интернет. Попробую найти и поставить 11 или 12 Файн Ридер, а то у меня, даже стыдно сказать, стоит 6-я версия ФР. Спасибо!
После пункта 6 из /post/5401/ я просто загружаю картинки формата tif из папки out в FineReader 12 и уже там сохраняю в двух форматах — pdf и djvu с распознаванием. Результаты достаточно хорошие, и совсем недавно архив формата pdf весом в 1,2 Гб (совершенно плохого качества) преобразовал в файл весом 71,3 Мб.
Для уменьшения размера я пользуюсь Orpalis PDF Reducer Pro - в общем доволен. Есть возможность настроить сжатие и качество, что важно. Также в IrfanView могу дополнительно изманять качество изображений. Кажется, нашел вариант отсканированию, который мне по душе.
почему-то зацыклены или не pdf, или djvu форматах.
Потому что из общеизвестных только эти форматы подходят для сканированных копий - а в свою очередь, только сканированная копия 100% точно отображает печатное издание. (Не считая варианта хранить таковые в виде пачки несшитых страниц, что, как правило, ещё тяжелее по весу).
Ох, больная тема. Для сканированию пользуюсь FastStone Capture + CamDS_TWAIN (стартируют одновременно - пользуюсь не скенером, а т.наз. документ-камерой, в случае Viisan VS5471), скенер только для переплётах. Первоначальная обработка изображениях в FastStone Capture, потом следует изменение размера и разрешения и вырезание в FastStone Photo Resizer, потом конечная обработка для уменьшения размера в IrfanView 64, и наконец собираю в Adobe Acrobat Pro... Звучит сложно, но на самом деле не так.Пробовал ABBYY ScanStation - не понравилась. FineReader тоже.
Пожалуйста, посмотрите, как мы отредактировали все Ваши описания. Данные должны выглядеть и располагаться именно так, как мы сделали. Лишнего указывать не нужно.
Комментарии
1) "Словарь русско- украинский" в 3томах 2го или 3го издания вот такой https://www.olx.ua/d/obyavlenie/slovar-russko-ukrainskiy-3t-IDJDUCc.html?reason=observed_ad
или 2е изд https://www.olx.ua/d/obyavlenie/russko-ukrainskiy-slovar-IDLWoQS.html?reason=observed_ad
2) Словник іншомовних слів випущений в 1985 за редакцією академіка АН УРСР О. С. Мельничука. вот такой https://www.olx.ua/d/obyavlenie/slovnik-nshomovnih-slv-za-redaktsyu-o-s-melnichuka-IDMgRGP.html?reason=observed_ad
3) "Короткий тлумачний словник української мови". 1988г Гринчишина
4) 5-я книга Білодід І. К. (ред.) Сучасна українська літературна мова. Стилістика ибо та что тут как видно не очень качественно оцифрована /file/1039107/
5) может есть другие какие укр словари советского периода с 1980 до распада (которых нет оцифрованными) ?С уважением,
Игорь
Я говорю про последнее издание 80х годов вот то что по ссылкам чуть ниже а не те 60х которые в инете уже есть
https://www.olx.ua/d/obyavlenie/slovar-russko-ukrainskiy-3t-IDJDUCc.html?reason=observed_ad
или 2е изд https://www.olx.ua/d/obyavlenie/russko-ukrainskiy-slovar-IDLWoQS.html?reason=observed_ad
Вначале я обратил внимание, что в выходных данных сокращение "усл." (печатных листов) перестало искажаться в "уел."
А недавно, обрабатывая исходник с "ошибкой инь", пришедшей от пережатого djvu, заметил, что FineReader 15 весьма эффективно исправляет (не все, но довольно многие) ошибочные подмены и/н.+
И спасибо snsdgbg за слитки! Надеюсь, они не увлекут меня... ко дну... )
По степени сжатия результаты, конечно, существенно различаются. Такое впечатление, что файл (1) сохранен с dpi=150, а (2) - dpi=300. Соответственно, различаются и размеры файлов на ~17%.
Если открыть файлы в редакторе (я пользуюсь PDF-Xchange), видно, что габариты изображений переднего слоя различаются в 3 раза (а в некоторых случаях - и в шесть!).Затем я закачал в FineReader 15.0 файл (2) в режиме использования наличного текстового слоя и повторно сохранил его, примерно, в тот же размер (dpi=300, сжатие 80). Качество заметно улучшилось - но зубцы бинаризации тем не менее остались.
Предварительный вывод таков: в новой версии FineReader использован менее качественный режим сглаживания черно-белых символов.
(Про цветные сказать ничего не могу, подожду, пока этим займутся другие, более сведущие люди.)Лично я не стремлюсь к аутентичному воспроизводству бумажных оригиналов, а ставлю на первое место наличие распознанного текстового слоя. Что позволяет индексировать электронную библиотеку и еще более делает ненужными бумажные.
Книги у вас хорошие и по части содержания, и по части качества ( сканирования). Большое спасибо!
Посмотрите эти посты и тему:
/post/5401/
/post/4682/
/post/4736/
/topic/6718/
Осканировал немецко-русский словарь К. Лейна, в котором 95 тыс. слов. Сканы словаря вставил в вордовский документ, страницы вышли черно-белые, но качество намно лучше, чем в pdf. Правда, файл вышел большой , разместить на сайте пока не получается: слабый интернет.
Попробую найти и поставить 11 или 12 Файн Ридер, а то у меня, даже стыдно сказать, стоит 6-я версия ФР. Спасибо!
Результаты достаточно хорошие, и совсем недавно архив формата pdf весом в 1,2 Гб (совершенно плохого качества) преобразовал в файл весом 71,3 Мб.
На мой взгляд, лучшая программа. 14-ю версию имею, пробовал, но как-то пока не сложилось )
(Не считая варианта хранить таковые в виде пачки несшитых страниц, что, как правило, ещё тяжелее по весу).
hast du zufällig den Rest, die Lösung dieses Buches:
/file/2661285/
danke im voraus
Данные должны выглядеть и располагаться именно так, как мы сделали.
Лишнего указывать не нужно.