llamaをローカルPCで使ってみた
公開 2023/09/12 12:04
最終更新 2023/09/12 15:28
Open Interpreterというものを使ってみたいと考え、使い方を紹介してくれているサイトを参考にインストールを試していたのだけれども、ChatGPT-4を利用するのは嫌(というか、お金が惜しい)なので、Metaから提供されているLlamaを使う方法を採用。

結果、どうやってもうまくいかないなぁ、と。

とりあえず、Llamaというものを使ってみようということで、llama.cppをダウンロード、あ、これはコンパイルしなきゃダメか。ということで、makeしてみました。

参考にしているサイト通り実行してみるも、モデルを読み込めない。(モデルはHugging Faceからダウンロードしてきたもの。"llama-2-7b-chat.ggmlv3.q4_K_M.bin")
一度も使ったことがないと何が悪くてダメなのかわからないのがつらいですね。
結局のところ、今のllama.cppはggml形式のモデルは使えなくて、gguf形式に変換する必要があるとのこと。変換ツールもllama.cppについていますし、Hugging Faceにgguf形式のモデルも掲載されています。
lliama.cppでは8月以降、仕様変更が実施されたようで、参考にした7月半ばの記事ではカバーされていなかったというお話。この業界、わずかなタイミングの差で状況が変わりますから、面倒ですね。
(本業だったら、髪をかきむしるようなお話。いや、私程度だったらLlamaがどうのとかいう仕事はまわってこないか。業界から足を洗って15年もたっているので、仮定のネタにもなりません。)

さて、原因は分かったところでいくつかサンプルを試してみるに最初の一回目がとても遅いのと、二回目以降も遅いのが気になりました。
一回目の遅い理由は、モデルを読み込むのに時間がかかっているんだなとは思います。モデル(ggufファイル)だけでも5GBとかありますからねぇ。HDDにおいてあるので、やむなしかなと。
で、二回目以降というのは一回目ほど遅くはないんですが、どうもGPUを使っていないような気が。

深く考えずmakeするとGPUを使わないかたちになるんですね。

落ち着いてcuBLASを利用するようにmake仕直したら、GPUを使うようになりましたが劇的に変わったという感じにはなりませんでした。数割増しくらい?こんなもんなんでしょうかね。
CPU負荷は気持ち軽くなったかも。

さて、llamaについて少しは理解したところで、Open Interpreterを...やっぱりよくわかりません。
でも、便利そうなんですよねぇ。もうちょっと頑張ってみるか。
最近の記事
おそらくこれがサブスク(Google AI Plus)の恩恵
Google AI Plusに課金して、はじめてAntigravityを使用した時。 おお、これが課金した効果かと感じた。 無課金のとき、Anti…
2026/02/11 08:44
Google AI Plusに乗り換えた
Googleのクラウドストレージサービス(Google Drive)を増量するだけの名目でGoogle One(月額290円)に加入していたのだけれども、…
2026/01/29 09:22
旧PCでLinuxは動くが...(というよりCore i3の罠?)
ZorinOS18、若干貧弱なPCでも快適に使えるので、結構重宝しているんだけれども、環境を整えて本格的に使おうとしたら挫折した話…
2026/01/27 08:43
AIに議席数予測させてみた:2026年衆院選
今回はFelo、Gemini(Gemini3 Fast)、Gemini Deep Research(Gemini3 Fast)、Perplexity。 ただし、中道改革連合の支持率が出て…
2026/01/22 16:41
これは確かに不満が出るわ。Inspiron 15 3525
なんか、使っている人が不満そうなんだけど、どう不満なのか言えないみたいな微妙なパソコン。 でも、ちょっと触ってみて、…
2026/01/20 17:52
ちょっと困っていた問題が解決した話
pythonを使ってRPA的な処理を作成しようとするとき、重宝するのがSelenium。 2025年7月頃から困ってたことが、最新リリース向…
2026/01/13 13:57
Ctrl+Wが恨めしいと思った日
社長が使わなくなったからってHHKB Professional Hybridをくれた。 (ちなみに社長はHHKB Studio(墨)を使ってる。キートップ…
2026/01/13 12:07
ZorinOSを入れてみた
Chrome OS Flexを旧型PCに入れていたんだけど、どうもデスクトップがすっきりし過ぎて落ち着かない。 いや、汚いのが良いとは…
2025/12/19 14:24
マイクロソフトは劣化が著しい
新しいパソコンが届いたのでセットアップしようとして、サーバ上の共有フォルダを開こうとしたら、「拡張エラー」??? エ…
2025/12/16 11:29
意外と使えそうなOnlyOffice
(申し訳ない、支離滅裂な駄文です。) Windows環境で事務作業をするならExcelは必須と思う。 企業で使うなら、MS Officeプ…
2025/12/09 09:13
Antigravity便利
できることが多いと使いこなすまでの苦労が多いのが困る。 というのは冗談。 機能が多くてもわからなければ使わなくていいし…
2025/12/03 09:00
Google Antigravityを入れた
Google Antigravityを使ってみた。Gemini Code AssistのAgent modeがオンになっているVSCodeとどう違うのかよくわからん。Gemin…
2025/11/24 17:38
ある意味安直な高速化、だけど人力では経験が必要な、だからLLM
作業量が大きくて時間のかかる集計処理。 pythonでやっているんだが、これはGoとかで書き直さなきゃいけないかなぁ... と…
2025/11/18 15:19
Github Copilot無料枠は月間縛りつらいが、Geminiがある
Github CopilotでGPT-5miniとかよりも、Claude Haiku 4.5がありがたいというネタもチャットクオータの壁には勝てない。(ただし…
2025/11/18 13:21
コードの変更はClaude系が強い
Gemini Code Assistは便利ということで愛用してきたわけだが、処理内容を変更せずにリファクタリングさせようとするとGithub Co…
2025/11/11 16:36
Gemini Code AssistのAgentモードが途中で停止すると...
Gemini Code Assistにリファクタリングをさせていたところ、原因不明で停止してしまった。 今日、実施していた感じでは、いく…
2025/10/24 16:27
ワイヤレスマウスの不調
会社で使用しているワイヤレスマウスが動きが悪いということで、動作確認をしてみた。 センサで使用している赤色LEDの様子を見…
2025/10/20 11:38
WiFiルーターを変更
安いのでTP-linkの‎Archer AX3000を導入した。 インターネットプロバイダーからレンタルでつかっていたんだけれども、思うとこ…
2025/10/14 11:09
恣意的という言葉は嫌い
「恣意的」その時々の思いつきで物事を判断するさま。 というのが、まず出てくるんだけれども、weblio辞書によれば、「意図…
2025/10/10 10:19
AIのせいで新人の仕事がなくなって、就職難とのお話
ここのところ、ネット記事で読むことが多いので思ったこと。 生成AIとかLLMとか、ChatGPTに代表されるようなAIが賢くなって…
2025/10/01 15:54
もっと見る
タグ
AI(38)
IT(20)
雑感(7)
IoT(6)
AI,(5)
IT,(5)
愚痴(5)
日記(3)
RPA(2)
アニメ(2)
ChatGPTで遊ぶ(1)
Windows11(1)
自動処理(1)
もっと見る