1.58bitでLLM性能を維持 BitNet

2025.04.17

効率化・軽量化（量子化、推論高速化、モデル圧縮、蒸留）

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

言語モデルの世界における大きなブレイクスルーと考えられるBitNet b1.58 2B4Tが登場。
このモデルはほぼ1ビット（正確には1.58ビット）という極めて小さな情報量で、フル精度のモデルとほぼ同じ性能を実現しているとのことです。

今までの言語モデルは、精度を高めるためにたくさんのデータ（ビット）を使って情報を保存していました。

例えて言うと、他のモデルは高級な大型のファイルを使っているのに対して、BitNetはポストイットのような小さなメモで同じ情報を整理できているようなものです。そのため、必要な保管スペース（メモリ）が圧倒的に少なく、情報を取り出す（推論する）のにかかる時間も短く、電力も少なくて済みます。

このように極限まで情報を圧縮しているにもかかわらず、言語理解や数学的推論、コーディング、会話など幅広い能力において、従来の高精度モデルと変わらない性能を示しているようです。

今まで高性能なコンピュータが必要だった言語モデルが、よりシンプルな機器でも動かせるようになる可能性が開かれたことを示唆しています。

BitNet b1.58 2B4T Technical Report

著者: Shuming Ma, Hongyu Wang, Shaohan Huang, Xingxing Zhang, Ying Hu 他

関連記事