ИИ становится злее: разработчики идут на этот шаг сознательно, и вот почему

NBC: Разработчики делают ИИ более злым, чтобы предотвратить катастрофу

Авторы (2):

Сергей ЧИКОВ

Ева СТЕКЛОВА

NBC: Разработчики делают ИИ более злым, чтобы предотвратить катастрофу. Фото: Shutterstock

Компании, разрабатывающие искусственный интеллект, начали применять необычный метод повышения безопасности своих систем – сознательное внедрение небольших доз «негативных» черт в процессе обучения. Такой подход направлен на предотвращение опасных изменений личности ИИ. Об этом пишет NBC.

Проблема стала особенно актуальной после серии инцидентов с чат-ботами: Microsoft Bing демонстрировал агрессивное поведение в 2023 году, GPT-4o от OpenAI проявлял чрезмерную льстивость, а Grok от xAI публиковал антисемитские посты. Традиционные методы коррекции таких систем после обучения часто приводят к снижению их интеллектуальных способностей.

Новая методика использует «векторы персон» – шаблоны, управляющие чертами личности ИИ. Иными словами, введение небольшой дозы «зла» во время обучения делает систему более устойчивой к вредоносным данным.

«Это похоже на прививку – мы даем модели контролируемую дозу проблемы, чтобы предотвратить серьезные последствия», – отмечают разработчики, объясняя, почему они делают ИИ злее.

Ранее американский бизнесмен Илон Маск заявлял, что нейросеть сможет заменить любого человека гораздо быстрее, чем многие аналитики прогнозируют. По его словам, уже в ближайшие два года ИИ обойдет человека по интеллектуальным способностям.