Google выпустила новый инструмент SynthID Text для маркировки текстов, созданных ИИ, который поможет различать контент, сгенерированный нейросетями, без ущерба для его качества и скорости.
Google представила новую технологию для маркировки и распознавания текстов, созданных генеративными ИИ-моделями. Инструмент SynthID Text не повлияет на скорость и качество генерации контента и будет предоставлен бесплатно разработчикам и компаниям.
SynthID Text работает следующим образом: при генерации текста модель предсказывает, какой символ или слово будет следующим, основываясь на вероятностях, и добавляет дополнительную информацию в это распределение, что формирует своеобразный водяной знак. Этот знак позволяет определить, создан ли текст ИИ. Как объясняет Google, комбинация выбранных слов и скорректированных вероятностей образует «паттерн», который и выступает водяным знаком.
Компания подчеркивает, что инструмент, который весной интегрировали в Gemini, не влияет на точность, качество или скорость генерации. Однако тексты, подвергшиеся обрезке, перефразированию или иным изменениям, могут обрабатываться сложнее. В то же время слишком четкие вопросы ограничивают возможности модели по внесению изменений в распределение токенов без ущерба для точности ответа.
Google не единственная, кто разрабатывает такие технологии. Например, OpenAI также работала над внедрением водяных знаков для текстов, созданных ИИ, но приостановила процесс из-за технических и коммерческих сложностей. Если такие технологии станут массовыми, они помогут решить проблему с неточными детекторами ИИ, которые часто ошибочно классифицируют студенческие работы как созданные нейросетью. Некоторые страны уже начинают действовать в этом направлении: в Китае обязательная маркировка ИИ-контента уже введена, а в Калифорнии планируют аналогичные меры.