Оценка новых моделей для нашей системы анализа рынка

February 26, 2025 · 3 min read

Architect

Хотите улучшить свою систему анализа рынка? Это глубокое исследование рассматривает две новые модели, которые могут значительно улучшить вашу систему сравнения рынков. Независимо от того, являетесь ли вы трейдером, ищущим лучшего понимания рынка, или квант-разработчиком, изучающим новые архитектуры моделей, эти идеи помогут вам использовать LLM и дополнительные критерии для более надежных торговых решений при сохранении эффективного управления рисками.

Эти новые модели предлагают захватывающие возможности для улучшения нашей системы сравнения рынков. Давайте проанализируем каждую из них и то, как они могут принести пользу нашему подходу.

DeepScaleR: Модель, оптимизированная с помощью обучения с подкреплением

DeepScaleR особенно интересен, поскольку это доработанная версия DeepSeek-R1-Distilled-Qwen-1.5B, которая достигает замечательной производительности с всего лишь 1,5 млрд параметров:

Ключевое преимущество: Достигает 43,1% Pass@1 на AIME 2024, превосходя O1-Preview от OpenAI, несмотря на гораздо меньший размер
Важная особенность: Оптимизирована с помощью распределенного обучения с подкреплением специально для задач рассуждения
Преимущество размера: При всего 1,5 млрд параметров (3,6 ГБ) она может эффективно работать на нашей существующей инфраструктуре

Эта модель может быть идеальной для наших задач анализа рынка, потому что:

Её оптимизация с помощью обучения с подкреплением, вероятно, улучшила её способности к рассуждению
Небольшой размер означает, что мы могли бы запускать её с минимальной задержкой
Она может служить нашей основной моделью анализа, потенциально заменяя DeepSeek R1 в нашей текущей настройке

OpenThinker: Модели рассуждения с открытым исходным кодом

OpenThinker предлагает два варианта (7B и 32B), созданные путем дистилляции DeepSeek-R1:

Преимущество набора данных: Обучен на OpenThoughts-114k, полученном из дистилляции DeepSeek-R1
Производительность: Вариант 32B достигает впечатляющих результатов в тестах на рассуждение
Открытый исходный код: Полностью открытый исходный код, дающий нам гибкость для настройки

Для нашей системы OpenThinker может быть ценным как:

Более мощная модель для сложного анализа рынка, требующего более глубокого рассуждения
Вторичная модель валидации для подтверждения анализа от нашей основной модели
Специализированная модель для финальных раундов турнира, где качество решений критично

Использование наших неиспользуемых серверных ресурсов

С двумя удаленными серверами (приличные CPU, 64 ГБ ОЗУ каждый), простаивающими, у нас есть отличная возможность реализовать многоуровневый подход к анализу:

Предлагаемая многоуровневая архитектура анализа:

Быстрый уровень (текущая инфраструктура):
- Использование DeepScaleR (1,5B) для начального анализа рынка и ранних раундов турнира
- Быстрое время отклика и эффективное использование ресурсов
- Обрабатывает основную массу сравнений с хорошим качеством
Уровень глубокого анализа (удаленные серверы):
- Развертывание OpenThinker-32B на удаленных серверах
- Используется для финальных раундов турнира, разрешения ничьих или ситуаций с низкой уверенностью
- Когда тщательность важнее скорости
- Может выполнять ночные пакетные анализы для сложных рыночных условий
Уровень валидации:
- Использование другой архитектуры модели (возможно, r1-1776) в качестве проверки валидации
- Сравнение результатов между различными архитектурами моделей для повышения уверенности
- Отметка расхождений для человеческого рассмотрения

Стратегия реализации

Тестирование моделей:
- Тестирование всех трех моделей на наборе репрезентативных сравнений рынка
- Оценка точности, качества рассуждений и характеристик производительности
- Определение оптимальных конфигураций для каждой модели
Разработка системы маршрутизации:
- Создание логики для направления задач сравнения на соответствующий уровень на основе:
  - Стадии турнира (ранние или финальные раунды)
  - Пороговых значений уверенности
  - Сложности сравнения
  - Чувствительности ко времени
Интеграция удаленных серверов:
- Настройка удаленных серверов с Ollama и более крупными моделями
- Реализация уровня API для бесшовной коммуникации
- Создание системы очереди заданий для пакетной обработки
Улучшенная система дополнительных критериев:
- Использование различных моделей для генерации дополнительных критериев
- Использование сильных сторон каждой модели для различных аспектов анализа
- Создание ансамблевых подходов, объединяющих идеи из нескольких моделей

Конкретные случаи использования для каждой модели

DeepScaleR (1,5B):

Первичный скрининг рынка
Ранние раунды турнира
Потребности анализа в реальном времени
Генерация первичных дополнительных критериев

OpenThinker (32B):

Финальные раунды турнира
Анализ сложных рыночных условий
Генерация сложных дополнительных критериев
Глубокий анализ переходов рыночных режимов

Модель валидации (r1-1776 или аналогичная):

Проверка решений с высокими ставками
Разрешение разногласий между другими моделями
Специализированный анализ для конкретных типов рынка

Заключение

Эти новые модели представляют отличную возможность улучшить нашу систему сравнения рынков, одновременно используя наши простаивающие серверные ресурсы. Реализуя многоуровневый подход, мы можем сбалансировать эффективность с тщательностью, используя правильную модель для каждой конкретной задачи.

Сочетание эффективности DeepScaleR и глубины рассуждений OpenThinker может значительно улучшить производительность нашей турнирной системы, особенно для настраиваемого продукта сортировки рынка на естественном языке, о котором мы говорили ранее.

Хотели бы вы, чтобы я разработал более подробный план реализации для интеграции этих моделей в нашу текущую систему? Или мы должны сначала сосредоточиться на их тестировании, чтобы определить, какие из них будут наиболее эффективными для наших конкретных случаев использования?

DeepScaleR: Модель, оптимизированная с помощью обучения с подкреплением​

OpenThinker: Модели рассуждения с открытым исходным кодом​

Использование наших неиспользуемых серверных ресурсов​

Предлагаемая многоуровневая архитектура анализа:​

Стратегия реализации​

Конкретные случаи использования для каждой модели​

DeepScaleR (1,5B):​

OpenThinker (32B):​

Модель валидации (r1-1776 или аналогичная):​

Заключение​