
この記事が掲載されている雑誌は、こちらからお読みいただけます。

LLMってなんとなく聞いたことあるけれど、一体何?
今号のSoftware Design (ソフトウェアデザイン)では、LLMのしくみを特集。
まずはLLMの基本構造についてをピックアップしてみました。
LLM(大規模言語モデル)は、生成AIが文章を生成したり理解したりするための根幹となる技術です。
初期の言語モデルがLLMへ、また自律的にタスクを実行するエージェントへと進化する過程にはさまざまな技術に発明や研究成果がありました。
それらについて知ることがLLMの理解の第一歩です。
LLMの基本構造
LLMはなぜ文脈を理解して回答できるのでしょうか。
LLMとは
人工知能(AI)という言葉は一般にも広く知られていますが、その中身は複数の技術層から構成されています。
AIとは「人間の知的活動を機械で再現する」ことを目的とした技術の総称であり、推論・判断・創造といった知的処理を扱います。
その中心になるのが「機械学習(Machine Learning)」です。
機械学習は、ルールを人間が明示的に与えるのではなく、データから経験的にパターンを学び取る手法です。
機械学習の一分野である「深層学習(Deep Learning)」は、人間の脳を参考にしたニューラルネットワークという手法を多層化したものでり、高度な特長を自立的に学習できるようにしたものです。
この深層学習技術を言語処理に応用し、文章の理解や生成を可能にしたのが「LLM(Larte Language Model、大規模言語モデル)」です。
LLMはモデルのサイズが単純に大きいだけではなく、パラメータ数、学習データ量、計算資源のすべてがそれまでのものとは比較して桁違いに大きくなりました。
たとえば、GPT-3は数千億のパラメータを持ち、数千億~数兆語規模のテキストを学習していると言われています。
これにより、単なる前後に出現する単語の統計的な予測を超え、知識の再利用や文体の模倣、推論的な応答が可能になりました。
LLMの社会浸透
このLLMが広く注目を集める契機となったのが、OpenAIが公開した「ChatGPT」です。
ChatGPTはLLMを対話形式に応用したもので、自然文による会話、質問応答、文章作成、要約、プログラム生成などを1つの仕組みで実現します。
LLMについて、基本がわかってきましたね。まだまだ、ここから学習プロセスや、実装へのチャレンジなども紹介されていますので、ぜひ本誌でご覧ください。
本誌では他にも、アルゴリズムについてなどを紹介されています。
Software Designが定期購読なら最大19%OFF!
ITエンジニアのスキルアップに!
「Software Design (ソフトウェアデザイン)」を定期購読すると1冊1,262円で購入可能!
毎号、買い忘れなく、送料無料でお手元に届きます。
ぜひ、この機会にご利用ください。
この記事が掲載されている雑誌は、こちらからお読みいただけます。






