MiniCPM-o 4.5 logo

MiniCPM-o 4.5

デバイス上でリアルタイムに動作する、フルデュプレックスのマルチモーダルAI

Artificial Intelligence GitHub Open Source

デバイス上でリアルタイムに動作する9BパラメータのオムニモーダルAI。視覚・聴覚・発話を同時に処理し、全二重ストリーミングを実現。ローカル実行が可能で、llama.cppとOllamaをサポート。GPT-4oを視覚ベンチマークで上回るとされる。著者は対話の自然さとオフライン運用の利点を強調している。

投票数: 10
← 投稿一覧に戻る