llamaをローカルPCで使ってみた | bdynFGのブログ

シンプルブログ

bdynFGのブログ

llamaをローカルPCで使ってみた

公開 2023/09/12 12:04

最終更新 2023/09/12 15:28

Open Interpreterというものを使ってみたいと考え、使い方を紹介してくれているサイトを参考にインストールを試していたのだけれども、ChatGPT-4を利用するのは嫌（というか、お金が惜しい）なので、Metaから提供されているLlamaを使う方法を採用。

結果、どうやってもうまくいかないなぁ、と。

とりあえず、Llamaというものを使ってみようということで、llama.cppをダウンロード、あ、これはコンパイルしなきゃダメか。ということで、makeしてみました。

参考にしているサイト通り実行してみるも、モデルを読み込めない。(モデルはHugging Faceからダウンロードしてきたもの。"llama-2-7b-chat.ggmlv3.q4_K_M.bin")
一度も使ったことがないと何が悪くてダメなのかわからないのがつらいですね。
結局のところ、今のllama.cppはggml形式のモデルは使えなくて、gguf形式に変換する必要があるとのこと。変換ツールもllama.cppについていますし、Hugging Faceにgguf形式のモデルも掲載されています。
lliama.cppでは8月以降、仕様変更が実施されたようで、参考にした７月半ばの記事ではカバーされていなかったというお話。この業界、わずかなタイミングの差で状況が変わりますから、面倒ですね。
（本業だったら、髪をかきむしるようなお話。いや、私程度だったらLlamaがどうのとかいう仕事はまわってこないか。業界から足を洗って１５年もたっているので、仮定のネタにもなりません。）

さて、原因は分かったところでいくつかサンプルを試してみるに最初の一回目がとても遅いのと、二回目以降も遅いのが気になりました。
一回目の遅い理由は、モデルを読み込むのに時間がかかっているんだなとは思います。モデル(ggufファイル)だけでも5GBとかありますからねぇ。HDDにおいてあるので、やむなしかなと。
で、二回目以降というのは一回目ほど遅くはないんですが、どうもGPUを使っていないような気が。

深く考えずmakeするとGPUを使わないかたちになるんですね。

落ち着いてcuBLASを利用するようにmake仕直したら、GPUを使うようになりましたが劇的に変わったという感じにはなりませんでした。数割増しくらい？こんなもんなんでしょうかね。
CPU負荷は気持ち軽くなったかも。

さて、llamaについて少しは理解したところで、Open Interpreterを．．．やっぱりよくわかりません。
でも、便利そうなんですよねぇ。もうちょっと頑張ってみるか。

AI

no name

プロフィールページ

最近の記事

AI比較：GeminiとCopilot、ChatGPT、Claude甲乙つけがたい

ちょっと遠出のドライブプラン（ルートと休憩２回）を作成させてみた。詳細は省くけど、印象としては、Gemini/Copilot/ChatGP…

2026/03/17 10:48

訃報：池田昌子さん（享年87）

あまりこういうことは残したくないんだけれども、この方のことは覚えていたい。３月３日永眠。合掌。でも、割と往生だった…

2026/03/13 16:51

いわゆる非公式アップグレード

DELLのInspiron 15 3525。個人的には十分高性能で、十分使えるのにと思っていたんだけれども、やむを得ない事情でリプレースし…

2026/03/12 09:46

CarbonOS on Redmi Note 5

ちょっと、昔のスマホを引っ張り出してきた。 UnofficialなFirmwareが入らないかと思って。使えそうなら、カメラとか専用機と…

2026/03/07 11:56

AI．．．こそっと間違いを入れるのは困る。

「与えた表面積の値を利用して、ニッケルメッキの重量を求めよ。」２問、問い合わせたところ、２つ目が異常に小さい結果にな…

2026/03/04 16:38

永代供養．．．事実上の無縁仏だなぁ

昨日、叔父の火葬を行ってきた。本日、お骨を近所の葬祭ホールとの契約で樹木葬してくるとのこと。叔父は財産もなく、妻…

2026/02/26 11:20

ローカルLLMに１８トークン／秒は遅いかと聞いてみた。

NVIDIA製Nemotron-Nano-9b-v2に聞いてみた。 Xeon W-2125/Quadro P5000(16GB)搭載機でNemotron-Nano-9b-Japanese(Q4-K-S)、LM …

2026/02/23 10:46

社内で古いノートPCをゲット

Windows11へのリプレースは順調とか言っても、Windows10からのアップグレードでそれなりに利用できていたパソコンはそのままに…

2026/02/18 09:43

antigravity: Gemini3 Flashでいいんじゃないか？

antigravityで、コーディング以外にもいろいろな仕事を任せられることがわかって、日々使っているとGemini3 ProだとLowでもHigh…

2026/02/17 13:43

自分の中で固まっていないことをやろうとすると困る

課金していても、一番低い料金だと、やはり使えるトークンが少ない。やりたいことがAIに伝わらないとき、試行回数が増える。 …

2026/02/13 14:51

選挙結果をAIに総括させてみた。

履歴の続きを利用して、「過去の予想を踏まえて総括してください。」と問い合わせてみた。結果、履歴内容を踏まえてきちん…

2026/02/13 09:19

おそらくこれがサブスク（Google AI Plus）の恩恵

Google AI Plusに課金して、はじめてAntigravityを使用した時。おお、これが課金した効果かと感じた。無課金のとき、Anti…

2026/02/11 08:44

Google AI Plusに乗り換えた

Googleのクラウドストレージサービス(Google Drive)を増量するだけの名目でGoogle One(月額290円)に加入していたのだけれども、…

2026/01/29 09:22

旧PCでLinuxは動くが．．．（というよりCore i3の罠？）

ZorinOS18、若干貧弱なPCでも快適に使えるので、結構重宝しているんだけれども、環境を整えて本格的に使おうとしたら挫折した話…

2026/01/27 08:43

AIに議席数予測させてみた：2026年衆院選

今回はFelo、Gemini(Gemini3 Fast)、Gemini Deep Research(Gemini3 Fast)、Perplexity。ただし、中道改革連合の支持率が出て…

2026/01/22 16:41

これは確かに不満が出るわ。Inspiron 15 3525

なんか、使っている人が不満そうなんだけど、どう不満なのか言えないみたいな微妙なパソコン。でも、ちょっと触ってみて、…

2026/01/20 17:52

ちょっと困っていた問題が解決した話

pythonを使ってRPA的な処理を作成しようとするとき、重宝するのがSelenium。 2025年7月頃から困ってたことが、最新リリース向…

2026/01/13 13:57

Ctrl+Wが恨めしいと思った日

社長が使わなくなったからってHHKB Professional Hybridをくれた。（ちなみに社長はHHKB Studio（墨）を使ってる。キートップ…

2026/01/13 12:07

ZorinOSを入れてみた

Chrome OS Flexを旧型PCに入れていたんだけど、どうもデスクトップがすっきりし過ぎて落ち着かない。いや、汚いのが良いとは…

2025/12/19 14:24

マイクロソフトは劣化が著しい

新しいパソコンが届いたのでセットアップしようとして、サーバ上の共有フォルダを開こうとしたら、「拡張エラー」？？？エ…

2025/12/16 11:29

もっと見る

タグ

アニメ（2）

ChatGPTで遊ぶ（1）

Windows11（1）

自動処理（1）

もっと見る

同一カテゴリーブログの新着記事

Pharmaceutical Glass Packaging: Borosilicate & Soda-Lime Glass for Injections & Vaccines

Global Leading Market Research Publisher QYResearch announces the release of its latest report “Glass Pharmaceutical Packaging Materials - Global Market Share and Ranking, Overall Sales and Demand Fo…

RcDFhLのブログ

熱重量分析計の世界市場：メーカー、地域、タイプ、アプリケーション別、2026-2032年の予測

GlobaI Info Research（所在地：東京都中央区）は、「熱重量分析計の世界市場2026年：メーカー、地域別、タイプ、用途別、2032年までの予測」の最新調査レポートを発表しました。本レポートでは、熱重量分析計市場…

bU58p4のブログ

Posted by no name

熱重量測定装置の世界市場：メーカー、地域、タイプ、アプリケーション別、2026-2032年の予測

GlobaI Info Research（所在地：東京都中央区）は、「熱重量測定装置の世界市場2026年：メーカー、地域別、タイプ、用途別、2032年までの予測」の最新調査レポートを発表しました。本レポートでは、熱重量測定装置…

bU58p4のブログ

Posted by no name

貧相輸送システムの世界市場：メーカー、地域、タイプ、アプリケーション別、2026-2032年の予測

GlobaI Info Research（所在地：東京都中央区）は、「貧相輸送システムの世界市場2026年：メーカー、地域別、タイプ、用途別、2032年までの予測」の最新調査レポートを発表しました。本レポートでは、貧相輸送シス…

bU58p4のブログ

Posted by no name

高温ガラス繊維フィルターバッグの世界市場：メーカー、地域、タイプ、アプリケーション別、2026-2032年の予測

GlobaI Info Research（所在地：東京都中央区）は、「高温ガラス繊維フィルターバッグの世界市場2026年：メーカー、地域別、タイプ、用途別、2032年までの予測」の最新調査レポートを発表しました。本レポートでは…

bU58p4のブログ

Posted by no name

炭素繊維表面マットの世界市場：メーカー、地域、タイプ、アプリケーション別、2026-2032年の予測

GlobaI Info Research（所在地：東京都中央区）は、「炭素繊維表面マットの世界市場2026年：メーカー、地域別、タイプ、用途別、2032年までの予測」の最新調査レポートを発表しました。本レポートでは、炭素繊維表…

bU58p4のブログ

Posted by no name

シンプルブログをはじめよう

複雑な時代だからこそ
シンプルなブログをはじめてみませんか？

簡単に無料ではじめられます。

はじめる（無料）