Okapi framework – проект с открытым исходным кодом. В состав проекта входит ряд свободных инструментов для проверки качества перевода, подготовки файлов к переводу и определению правил сегментации. Для работы требуется Java (несмотря на то, что на сайте указана необходимость установки только JRE, нужно установить ещё и JDK).

Rainbow

Rainbow – кросс-платформенное графическое приложение с помощью которого можно запускать различные инструменты для подготовки текста к переводу. Как и другие инструменты из пакета Okapi, Rainbow использует фильтры для работы с различными файлами и их преобразованием в те форматы, которые позволяют фреймворку изменять эти файлы. Используемые фильтры дают возможность работать с файлами OpenOffice, MS Office, XML, HTML, DTD, Properties и т.д.

Rainbow также работает с коннекторами, которые позволяют подключать различные системы машинного перевода (Google MT, Microsoft Translator, Open-Tran, MyMemory, Translate Toolkit TM, Apertium, TDA-Search). Также внутренние задачи Rainbow можно объединять в общий процесс для проведения различных операций над файлами в полуавтоматическом режиме.

Основные функции Rainbow это:

  • создание пакетов проектов для перевода (XLIFF, OmegaT, RTF для Trados);
  • изменение кодировки текста или разрывов строк;
  • изменение формата файлов;
  • извлечение терминологии и проверка качества перевода;
  • перевод с использованием систем машинного перевода и переводческой памяти;
  • псевдо-перевод и редактирование текста-оригинала;
  • применение шаблонов XSLT и сравнение различных переводов;
  • поиск и замена текста по фильтрам, а также формирование корпуса параллельных текстов.

Программные конвейеры / Pipelines

Программные конвейеры – это ряд операций по подготовке и переводу файла. Конвейеры позволяют также проверять качество перевода, изменять изображения в документе и извлекать из перевода терминологию. Главное окно Rainbow выглядит следующим образом:

Главное окно Rainbow

Создать новый конвейер можно в пункте меню Utilities или с помощью кнопок Ctrl + P. В диалоговом окне можно добавлять новые операции для выполнения, загружать уже существующий файл конвейера, сохранять новый конвейер и запускать его работу.

[wp_ad_camp_2]

Проверка качества и редактура

  • Whitespace Correction. Крайне полезная операция при переводе на японский или китайский языки или обратно: убирает пробелы или расставляет их обратно;
  • Text Modification: Позволяет заменять ASCII-символы на символы из расширенного латинского алфавита и кириллицы, а также заменяет определенные буквы на Х, а цифры на N;
  • Space Quality Check: Сравнивает оригинальный текст и текст перевода и исправляет при необходимости пробелы вокруг кодов.
  • Quality Check: Операция, все действия которой выделены в отдельное приложение фреймворка, о котором вы можете прочесть ниже. Делает всё то же самое, но в рамках одного окна;
  • Search and Replace: Простейшая функция поиска и замены. Меня выручает постоянно, потому что позволяет даже при поверхностном знакомстве с регулярными выражениями искать и исправлять общие ошибки;
  • Inconsistency Check: Эта операция проводит проверку перевода одинаковых сегментов текста-оригинала. В случае, если перевод таких сегментов отличается, она их пометит как ошибочные;
  • Cleanup: Операция Cleanup служит для редактирования текста-оригинала и исправления проблем с пунктуацией, кавычками и неожиданными символами. При включении данной операции в конвейер появляется возможность задать регулярное выражение, согласно которому конвейер пометит сегменты, которые нужно удалить.

Перемещение файлов

Copy or Move

Операция, которая в ручном режиме заменяет создание ежедневной резервной копии. Позволяет перемещать или копировать файлы в заданное место с последующей перезаписью, сохранением или пропуском при наличии уже существующих файлов.

Работа с переводческой памятью и терминологией

  • Diff leverage. Даёт возможность сравнивать две версии одного текста-оригинала и, при нахождении одинаковых сегментов, копировать уже существующий перевод. Можно использовать одно-, двуязычный или три одноязычных файла. Обратите внимание на то, что скопированный перевод сегментироваться не будет;
  • Generate SimpleTM | SimpleTM to TMX. Эти задачи рекомендую выполнять одновременно. Generate SimpleTM создает корпус параллельных текстов из нескольких документов для дальнейшего их внесения в переводческую память SimpleTM. Второй шаг переводит память SimpleTM в стандарт ТМХ, который впоследствии можно будет импортировать в любой САТ-инструмент, который вы используете;
  • Translation Comparison сравнивает перевод с несколькими другими переведенными документами. Результаты можно получить как в HTML-таблице, так и в файле TMX;
  • Term Extraction — одна из самых полезных функций. К сожалению, для русского языка работает не всегда корректно. Позволяет создать список возможных (важно!) терминов на основе документа-оригинала;
  • Sentence Alignment и Paragraph Alignment создают корпус параллельных текстов по предложениям и абзацам.
  • Segmentation — операция, которая позволяет задавать свои правила сегментации текста, в случае если стандартные сработали некорректно;

Подсчет слов и символов

Для простого подсчета слов и символов в исходном тексте используются следующие операции: Word Count, Character Count и Simple Word Count.

Разница в Word Count и Simple Word Count в том, что Simple Word Count подсчитывает количество слов в каждом сегменте и создает в исходном тексте примечания в сегментах. Word Count же просто подсчитывает количество слов в документе.

Image Modification

Простая операция группового редактирования изображений, которая позволяет изменять размеры и переводить изображения в шкалу серого цвета.

CheckMate

CheckMate это ещё одно приложение из фреймворка Okapi. Оно используется только для проверки перевода согласно заданным правилам. Принцип работы крайне прост: необходимо добавить документ, настроить правила проверки и нажать кнопку «Check Document».

Правила настраиваются через пункт меню Issues — Edit configuration.

Вкладка с общими настройками даёт возможность проверять наличие пустых сегментов, сегментов, перевод которых совпадает с текстом оригинала, а также предупреждает о наличии повторяющихся слов.

Вкладка с настройками длины текста очень важна для локализаторов, потому что очень часто появляются требования соблюсти определенную длину перевода в символах.

Настройки Inline Codes и Patterns проверяют соответствие кодов и шаблонов заданным параметрам. По умолчанию, на соответствие шаблонам проверяются закрывающие и открывающие скобки, почтовые и адреса сайтов, IP-адреса и прочий неизменяемый текст.

CheckMate позволяет подключать веб-версию LanguageTool, которая проверяет текст согласно своей базе данных. Стоит помнить, разумеется, о том, что подключение сервера LanguageTool или использование веб-апплета существенно увеличивает время проверки документа.

Okapi: Заключение

Okapi, как и другие подобные инструменты, предназначен для выполнения рутинных операций и первоначальной проверки документов после перевода. Рекомендуется, разумеется, использовать только для перевода, где критически важно следование терминологии и/или определенным правилам.

Image credit: Juan Bosco

[wp_ad_camp_2]

Добавить комментарий