В Кыргызстане создана рабочая группа по внедрению кыргызского языка в сервис Google Translate. Об этом сегодня, 21 июля, в интервью K—News рассказал Улан Джумашев, один из руководителей рабочей группы.
Почему возникла необходимость создания онлайн-переводчика на базе Google Translate?
Кыргызстан – страна с высоким проникновением Интернета, тем не менее, онлайн-ресурсов на государственном языке, по нашим данным, всего 5 %. При этом на нем говорит большая часть населения. Как следствие, возникает информационный вакуум, теряется важная и актуальная информация, отстает развитие и распространение государственного языка.
Сегодня тяжело представить себе любую деятельность без Интернета, будь то бизнес, учеба или просто развлечение. Так и родилась идея создания онлайн-переводчика на базе сервиса Google Translate. Она витала давно, но по-настоящему взялись за дело мы только в июле 2011 года. Главными инициаторами проекта стал я и мой партнер по бизнесу, позже через социальные сети у нас нашлись единомышленники.
Кому будет полезен google-переводчик?
Его появление особенно актуально в свете полного перевода документооборота на государственный язык. Он будет полезен и госслужащим, и бизнесменам, и студентам, и более широкому кругу населения. Во-первых, это позволит создать базу для изучения государственного языка – то, о чем сейчас говорят наши депутаты. Во-вторых, это станет удобным инструментом для тех, кто языком не владеет, но вынужден с ним сталкиваться — для деловой переписки, например. В-третьих, это повлечет рост числа Интернет-пользователей среди кыргызоязычного населения.
Как вы планируете наполнять языковую базу для онлайн-словаря?
На сегодняшний день есть несколько веб-сайтов, на которых доступны кыргызско-русские переводчики. Однако они переводят только слова, в то время как чувствуется острая потребность в переводе целых фраз, идиом, больших текстов и официальных документов. Мы планируем привлечь эти веб-сайты для объединения языковой базы.
Существует несколько классических словарей, но они устарели. Например, словарь Константина Юдахина, если я не ошибаюсь, был издан в сороковых годах прошлого века. За более чем 70 лет, кыргызский язык претерпел изменения и пополнился неологизмами и заимствованными словами. Языковая база онлайн-переводчика будет основана на оцифрованных классических словарях с добавлением терминологической и технической информации. Помимо этого, опытные лингвисты-переводчики будут работать над проверкой корректности перевода, и добавлять новые словесные единицы в реестр.
Когда сервис станет доступным?
Мы планируем собрать к январю 2012 года определенное количество так называемых языковых пар (например, кыргызский-русский) и загрузить эти файлы в специальный инструмент для переводчиков Google Translate Toolkit. Соответственно, далее нужно увеличивать количество языковых пар и после этого можно начинать переговоры с Google о подключении их технической команды в работу над введением кыргызского языка в сервис.
Каковы дальнейшие планы рабочей группы?
В случае успешной реализации этой стадии проекта, мы планируем следующие шаги:
1) Развитие сообщества поддержки кыргызского языка, куда войдут не только активные Интернет-пользователи, но и государственные органы, коммерческие структуры и все заинтересованные лица.
2) Перевод программного обеспечения. В первую очередь, операционных систем Windows и Android, а также программных пакетов Microsoft Office и Open Office – все то, что необходимо для полноценной работы за компьютером. Кроме того, на основе платформы поддержки переводчиков, возможно открытие системы краудсорс переводов FOSS, которые созданы для образовательных целей (в том числе для детей).
3) Создание локального стандарта клавиатуры с кыргызскими буквами.
Кто финансирует проект?
По приблизительным подсчетам, проект оценивается в 10,5 тысяч долларов. Рабочая группа уже подала заявки в несколько организаций на получение донорской помощи. Однако мы не можем полагаться только на них. Мы надеемся, что граждане и частные компании поддержат нашу инициативу. Так как проект реализуется на общественных началах, его основополагающий принцип – прозрачность бюджета и деятельности. Весь текущий баланс финансовых средств будет отображаться на сайте.
Кроме того, на основе платформы поддержки переводчиков, возможно открытие системы краудсорс переводов FOSS, которые созданы для образовательных целей (в том числе для детей).