0
DeepSeek-R1: Новые возможности AI в Web3
Выпущен DeepSeek-R1 — открытая модель рассуждений, которая сопоставима с ведущими AI-моделями при низких затратах на обучение. Это новшество ставит под сомнение традиционные законы масштабирования в AI и подчеркивает качество китайских инноваций в этой области.
Ключевые инновации DeepSeek-R1
- Использует фреймворк предобучения, аналогичный другим базовым моделям, состоящий из трех основных этапов:
- Предобучение на неразмеченных данных
- Супервизированное дообучение (SFT) для выполнения инструкций и ответов на вопросы
- Согласование с человеческими предпочтениями
- Разработан на базе модели DeepSeek-v3-base с 617 миллиардами параметров.
- Введен R1-Zero, обученный в основном через обучение с подкреплением, обладающий заметными способностями к рассуждению.
- Сгенерированы синтетические наборы данных для рассуждений через R1-Zero для дообучения DeepSeek-R1, что привело к улучшению производительности по сравнению с R1-Zero.
Последствия для Web3-AI
- Сети дообучения с подкреплением: Позволяют децентрализованным сетям участвовать в настройке моделей.
- Генерация синтетических наборов данных для рассуждений: Децентрализованные узлы могут автономно создавать наборы данных, что повышает уровень автоматизации.
- Децентрализованный вывод для малых моделей: Меньшие модели подходят для развертывания в децентрализованных средах.
- Происхождение данных рассуждений: Повышает прозрачность в задачах рассуждения, позволяя отслеживать каждый шаг рассуждения.
Выпуск DeepSeek-R1 представляет собой значительный шаг в генеративном AI, потенциально более тесно интегрированном с принципами Web3. Достижения в области рассуждений и обучения моделей могут способствовать эволюции AI-ландшафта в соответствии с децентрализованными технологиями.