Meta придумала метод, который позволяет ИИ обучаться без участия человека
Компания Meta представила метод Self-Taught Evaluator, позволяющий генеративной модели на основе искусственного интеллекта самостоятельно обучаться без вмешательства человека. Об этом пишет РИА Новости со ссылкой на пресс-релиз компании.
«Итак, мы выпустили Self-Taught Evaluator — новый метод генерации синтетических данных предпочтений для модели вознаграждения, не основываясь на комментариях человека», — говорится в сообщении.
Моделирование вознаграждения — это подход машинного обучения искусственного интеллекта на основе обратной связи, оценки или подсказки.
Из релиза Meta следует, что новый подход включает в себя процесс выстраивания логических цепочек на основе непрерывной схемы самосовершенствования модели.
Кроме того, компания сообщила о выпуске генеративной модели вознаграждения на основе прямой оптимизации предпочтений в инструменте машинного обучения RewardBench, основанной на данных без использования пояснений человека.