Вчера, 7 августа, компания OpenAI официально заявила, что теперь владельцы веб-сайтов могут запретить поисковому роботу GPTBot, который занимается сбором информации для обучения языковой модели для ChatGPT, доступ к своим информационным ресурсам. Для этого достаточно прописать запрет в файле robots.txt (по аналогии с поисковым роботом Googlebot) или заблокировать IP-адрес поискового робота чат-бота. И это очень важный шаг для пользователей, которые не хотят предоставлять возможность системе на базе искусственного интеллекта использовать уникальный контент для обучения большой языковой модели.
При этом стоит отметить, что блокировка поискового робота GPTBot не удаляет из базы данных чат-бота контент, который система уже получила при поиске данных в сети, а лишь запрещает системе в дальнейшем обучаться на этом же информационном ресурсе. Вероятно, аналогичные инструменты в ближайшем будущем представят и другие крупные разработчики больших языковых моделей, да и власти некоторых стран уже активно говорят о необходимости ограничений обучения ИИ и внедрении специальных водяных знаков, указывающих на то, что контент создан при помощи искусственного интеллекта. Впрочем, пока что никаких ограничений для OpenAI нет.