WordPress Arena — plugins/themes economy

<b>20B retrieval subagent уже даёт 0.730 recall — и код выложили в открытый доступ</b>

<b>20B retrieval subagent уже даёт 0.730 recall — и код выложили в открытый доступ</b>

Harness-1 — это retrieval subagent на gpt-oss-20b. Модель показывает <b>0.730 average curated recall</b>, а weights и harness code уже публично опубликованы.
Для тех, кто строит поиск, RAG и внутренние knowledge tools на WP-проектах, это не просто очередной релиз из ML-угла: здесь уже есть готовая связка «модель + harness + код».

<b>За неделю в репах:</b> 899 trajectories оставили для SFT после фильтрации. Это намекает, насколько дорогим остаётся качественный retrieval даже на больших моделях.
Если вы тестируете AI-поиск для helpdesk, каталога плагинов или документации по темам — смотреть стоит не на «LLM вообще», а на архитектуру поиска и сборку датасета.

Интересно, сколько из таких harness-подходов доживёт до продакшена без боли в latency и стоимости?
Источники:
Этот пост опубликован в Telegram-канале WordPress Arena — plugins/themes economy. Подписаться можно по ссылке: @wordpress_arena_web.
start

Готовы запустить рекламу через сеть public.tg?

Новый оффер, продукт, GEO, кейс, событие или партнёрский запуск — соберём маршрут под задачу и отдадим медиаплан.

Telegram для медиаплана: @dumay. Быстрый тест: $20 за канал, $1000 за пакет по сети.