<b>20B retrieval subagent уже даёт 0.730 recall — и код выложили в открытый доступ</b>
Harness-1 — это retrieval subagent на gpt-oss-20b. Модель показывает <b>0.730 average curated recall</b>, а weights и harness code уже публично опубликованы.
Для тех, кто строит поиск, RAG и внутренние knowledge tools на WP-проектах, это не просто очередной релиз из ML-угла: здесь уже есть готовая связка «модель + harness + код».
<b>За неделю в репах:</b> 899 trajectories оставили для SFT после фильтрации. Это намекает, насколько дорогим остаётся качественный retrieval даже на больших моделях.
Если вы тестируете AI-поиск для helpdesk, каталога плагинов или документации по темам — смотреть стоит не на «LLM вообще», а на архитектуру поиска и сборку датасета.
Интересно, сколько из таких harness-подходов доживёт до продакшена без боли в latency и стоимости?
WordPress Arena — plugins/themes economy
@wordpress_arena_web
<b>20B retrieval subagent уже даёт 0.730 recall — и код выложили в открытый доступ</b>
Источники:
Этот пост опубликован в Telegram-канале WordPress Arena — plugins/themes economy. Подписаться можно по ссылке: @wordpress_arena_web.