Microsoft выпустила ИИ-модель Phi-4 15B — она сама решает, когда ей «думать»
Компания Microsoft официально презентовала новую модель искусственного интеллекта — Phi-4 15B. Не самое лучшее название для запоминания, однако всё это нивелируется главной особенностью разработки. Как говорят создатели ИИ-модели, она точно знает, когда надо прекратить «думать», что крайне редко встречается в моделях с открытым исходным кодом.
Модель Phi-4-reasoning-vision-15B, насчитывающая 15 миллиардов параметров, предназначена для решения самых разных задач. Она может создавать подписи к изображениям, привязывать элементы пользовательского интерфейса и решать сложные математические примеры. В Microsoft разработали ИИ-модель таким образом, чтобы она самостоятельно принимала решение, когда необходимо активировать режим мышления, а когда лучше дать быстрый и точный ответ.
У большинства аналогов функция мышления включается и отключается самим пользователем. С одной стороны, решение делегировать эту возможность искусственному интеллекту может дать довольно интересные результаты, но, с другой стороны, эти результаты могут оказаться весьма непредсказуемыми.
В Microsoft рассказали, что модель Phi-4 15B обучалась всего на 200 миллиардах токенов. Для сравнения, крупные ИИ-модели используют более триллиона токенов, чтобы добиться необходимой производительности. К тому же, команда разработчиков тщательно подбирала контент для процесса обучения. В теории это означает, что новая ИИ-модель от Microsoft должна давать более точные ответы, так как обучалась на качественных данных. Но на практике это не обязательно так, если учитывать, что разработчики использовали GPT 4o для помощи в обучении.
Чтобы показать производительность Phi-4 15B, Microsoft опубликовала результаты тестирования в разных бенчмарках, сравнив их с результатами моделей того же класса и результатами моделей, слегка превосходивших новую разработку «мягкотелых». Стоит отдать должное компании — она не стала завышать показатели, а показала, как на самом деле обстоят дела. Результаты оказалась противоречивыми. Если в некоторых тестах Phi-4 15B обходит даже более крупные модели, в других она может уступить своим прямым конкурентам.
Серия ИИ-моделей Phi-4 от Microsoft, отличающихся низким уровнем сложности, часто недооценивается, поскольку сообщество разработчиков программного обеспечения с открытым исходным кодом больше сосредоточено на моделях LLM от китайских компаний, например, Qwen 3.5. Тем удивительнее, что американский техгигант практически не вкладывает средства в рекламу своих моделей.
