AI

AI

大規模言語モデル(LLM)の内部構造をざっくり解説

LLM(大規模言語モデル)って最近よく耳にしますよね。ChatGPTなどで注目されていますが、「中で何が行われているの?」と思ったことはありませんか?本記事では、難しい数式やアルゴリズムの厳密な話は抜きにして、LLMの内部構造をざっくりと解...
AI

深層学習のCNN、VGG、ResNetの内部構造と仕組み

こんにちは。この記事では、深層学習の代表格であるCNN(Convolutional Neural Networks)と、その中でも特に注目すべきモデル―VGG、ResNet、Inception、DenseNet、MobileNet、Effi...
AI

LLMを活用したAIエージェント:OpenAI Operator、Manus、Browser Useを徹底解説

デジタル化が進む現代において、オンラインでのタスク管理はますます煩雑になっています。そんな中、私たちのデジタルライフをサポートしてくれるかもしれない存在、それがAIエージェントです。大規模言語モデル(LLM)を搭載したAIエージェントは、単...
AI

LLMを使ってDiscussionの合成データを作成する手順

こんにちは。今回は 合成データの作成 をテーマに、PythonとLLM(大規模言語モデル)を活用して議論風の対話データを自動生成してみる方法をご紹介します。合成データを作ることで、実際の人間同士のやり取りを再現したい場合や、対話モデルの学習...
AI

2024年松尾研LLM講座の最終コンペで取り組んだこと

今回のコンペでは決勝に残ることはできませんでしたが、試行錯誤を重ねて点数を伸ばすことができ、スコア3.2で70位で終了することができました。試行錯誤をしている時間は大変でしたがとても楽しく充実していました。 はじめに これまで、CNNやRN...
AI

Llama3.1 8BモデルにLoraとDPOアダプタの接続したものをまとめてHuggingface保存する方法

この記事では、Llama3.1 8B Instructモデルに作成済みのLoRAアダプタとDPOアダプタを統合し、最終的にHugging Face Hubにアップロードする方法を詳しく解説します。 必要なライブラリのインストール まずは、必...