Category: Microposts
Chrome用の拡張機能「Volume & Sound Normalizer Pro」を作成開始しました
Volume & Sound Normalizer ProというChrome用の拡張機能を作り始めました。
これはVTuberやストリーマーのライブ配信を視聴する際、音量バランスがみんなバラバラ……という問題を解決するためのものです。
現在は、YouTubeとTwitchでチャンネル別にコンプレッサーと音量調整の設定を覚えさせることができます。(バージョン1.4.0としています)
Chrome Web Storeでの公開は検討中です。近いうちに多言語化もしたいですね。
なるほど、そういう事情も込みでリソースに余裕がないのか。
Open AIのGPU不足 www.perplexity.ai/page/open…
流石にiPhone SE 第2世代からiPhone 16eだと性能の差がすごくて、ブラウザのタブの切り替えとかの地味なところでも高速になったなーと感じる。
しかし端末としてはでかいな……まあ我慢ごろではあるんだろうけど。サブのAndroid端末と変わらない程度ではあるか……。
持ち上げると画面がスリープ解除するのは便利だなと感じるけど、Face IDは正直微妙だ。画面に顔を近づけすぎているので認証のとき離さないといけない。視力がなあ。
GPT-4.5のプレビューが出たようですね。今は出先でPCが使えないので詳しい情報が分かりませんが、Claude 3.7と比較するとなんか微妙なような……?
スコアは悪くないと思うのですが、かなりの大規模モデルなようで、GPT-4o以上にコストがかかると明言していますし、APIとかのコスト的にどうなの? という感触が。
碧依さくら2nd single “ひらひら” リリース
碧依さくら2nd single "ひらひら"がリリースされました🌸
— 碧依さくら❄️🌸🎧 (@sakura_aoi_main) February 27, 2025
是非たくさん聴いてください♡✨
そしてMVが28日22:00~公開されますので、また待機所作り次第ポストいたします!
そちらもプレミア公開なので一緒に聴きましょうᐕ)ノ
公開後はいっぱい聴いてください❄️https://t.co/ocQj6TqD9c
Micro.blog、1月ほど使ってみてかなり気に入ったので、一つプランを上げてみた。
これでテーマが弄れるのでとりあえず日付の形式を変えてみた。あと他サービスへの投稿もオンにした。
タグの付け方少し見直して、短い呟きはタグなしにして、ブログ記事っぽいものだけにブログって付けようか。
AnthropicのClaude 3.7 Sonnetが出ましたね。公式の紹介文はこんな感じです。
Today, we’re announcing Claude 3.7 Sonnet, our most intelligent model to date and the first hybrid reasoning model on the market. Claude 3.7 Sonnet can produce near-instant responses or extended, step-by-step thinking that is made visible to the user. API users also have fine-grained control over how long the model can think for.
市場初のハイブリッド推論モデルということで、スイッチで時間を使う拡張思考モード(推論ありという理解でいいのかな?)に切り替えることができるようです。
自分はKagiのThe Assistant経由(つまりAPI経由)のアクセスになるので、そこはすぐには試せませんが……ちょっとだけ試したところ、日本語の散文生成でも確かに良くなってるような感触を受けました。
前バージョンの3.5はSonnetとHaikuがあって、さらに前バージョンの3にはOpusがあって、規模的にはOpus > Sonnet > Haikuという理解ですが、Sonnetだけ新しくなりましたね。
あまり巨大なモデルは実行の負荷が高いし、規模が小さくレスポンスが早いモデルだと他社との差が少ないし……みたいな理由でしょうか。
Claudeは自然言語の処理にも優れている印象があって、個人的には好きなLLMです(noteの方に生成してみた短編小説を掲載しています)。
KagiのUltimateをやめておまけのLLM利用権を無くして、代わりにClaudeのProにするのもアリだなーと思える程度には。
(年間契約で$18/月とちょっとお安いのも魅力です。Pro版でも使用回数の制限はありますが5時間ごとのリセット方式なようなので、あまり困りそうにもないですし)
なお、無料版でも拡張思考モード(Extended thinking)が使えないだけで、最新のClaude 3.7 Sonnetが使えるようになっているらしいので、試してみてはいかがでしょうか。スマートフォンアプリとWebアプリがあります。
#blog
Slime Sweepというスマートフォン向けのゲームを始めたのだが、広告が多いので広告解除を買うかどうか迷ってKagiのThe Assistant機能で調べてみた結果がこんな感じ。うーんどうするかなあ。
ゲームとしてはPowerWash Simulatorをスマートフォン向けに落とし込んだかな? という感じなんだけど。
Slime Sweepは、スライムを使って街を掃除する3Dアクションゲームで、プレイヤーからさまざまな評価を受けています。以下にその評判をまとめます。
良い評判
- 可愛らしいゲームデザイン: スライムのキャラクターやゲームのビジュアルが可愛らしく、プレイヤーを引きつける要素として評価されています1。
- 多様なアップグレード: スライムのサイズアップやスピードアップ、バディシステムなど、豊富なアップグレードオプションがゲームの楽しさを増しています23。
- 多様なステージ: 街だけでなく、古城や工場など、さまざまなステージが用意されており、探索要素も楽しめます2。
- 報酬システム: 汚れを掃除するたびに報酬が得られ、コレクションアイテムを集めることでスライムを強化できる点が好評です34。
悪い評判
- ゲームメカニクスの説明不足: ゲームの仕組みが十分に説明されておらず、プレイヤーが試行錯誤しながら進めなければならない点が不満として挙げられています5。
- インストールの問題: 一部のユーザーから、ストレージの空き容量不足やネットワーク接続の不安定さによるインストール失敗の報告があります6。
総評
Slime Sweepは、可愛らしいビジュアルと多様なアップレードオプションが特徴で、特に探索や報酬システムが楽しめるゲームとして評価されています。一方で、ゲームメカニクスの説明不足やインストールに関する問題も指摘されています。全体的には、暇つぶしやリラックス目的でプレイするのに適したゲームと言えるでしょう13。
#blog
ワイヤレスイヤフォン、カナル型は音質はいいんだけど耳を塞いでるせいで都合が悪いことがある(喋った時に違和感あるとか色々)。
で、インナーイヤー型も使い始めたけど、イヤーカフ型(イヤークリップ型)を買ってみていい感じ……というのは前にも書いたけど、メリットとして一番差があるのはバッテリー持ちかもしれない。
最近買った中で一番の当たりは多分これ。レンジでラーメン作れる器。
昔ガラスの買ったこともあるんだけど、プラスチックの方が扱いやすいし、ちょっと高いからか多少高温になっても曲がったりしなさそうでいい。あとコストに見合う程度には細かいところに気が使われている感あります。
先に水を入れて線で計測する、450ccで500Wなら6分、あとは1分刻みというところだけ覚えておくと良さそう。袋に書いてはあったけど袋取っておくのも大変なので……。
Chromeの機能拡張からOllamaのOpenAI API互換APIを叩くにあたって、CORSの設定は以下のようにすれば良いらしい。
OLLAMA_ORIGINS=chrome-extension://<<ID>>
自分の場合はlaunchctlで環境変数を設定しているので、こんな感じになった。最初IDの後のスラッシュまで入れたらダメで、スラッシュを削ればOKだった。
launchctl setenv OLLAMA_ORIGINS "chrome-extension://aaaaabbbbcccccdddd"
情報元はここ。IDは機能拡張の設定ページとか出すのが一番手っ取り早いと思った。(ChromeストアのURLもIDらしいけど)
Kagi TranslateはKagiが提供する翻訳サービスで、OrionブラウザやKagi Searchに組み込まれている。
翻訳品質は高いようで、試した範囲では自然な訳文が多いと感じた。これは複数の言語モデルを組み合わせた仕組みによるものである。
ただし課題もあって——
- iframe方式を採用しているため、動的生成ページやフレーム構造のページが翻訳できない
- 翻訳言語を毎回選択し直す必要があるのが面倒
- Orionブラウザでは、ページ内の文章を直接置き換える方式が望ましい
あと、Orionにおいては要約機能と同じように、別パネルでの翻訳ページ表示オプションがあると便利かもしれない。
OllamaとOpen WebUIを導入して、ローカルでLLMを動かせるようにしてみた。
OllamaはOpen AI APIとも互換性のあるAPIを提供しているので、CORSの許可などの設定が若干必要だが、Open AI APIを使って動かしたいローカルアプリ(翻訳ツールとか)を動かすこともできる。
M4 Mac mini (共有メモリ16GB)モデルだとどれぐらいのLLMを動かせるか分からなかったので、Gemmaの2Bをベースに日本語にファインチューンされたモデルを使用してみている。(DeepSeek R1の7Bの日本語ファインチューニングのモデルも普通に動かせはした)
今でもときどき使っているEndelの紹介リンクです。リラクゼーションミュージックというか。フォーカス時も使うのでヒーリングだけでもないんですが。歌入りだとBGMにしづらいけどBGM探すのが面倒な人向けですね。
さあ、
この無料コードでEndelをお試しください!
科学的に証明された、集中力、リラックス、睡眠に役立つサウンドを14日間お使いいただけます。
スマートフォンの普及で、ブラウザ→サイト用の単機能アプリの流れが続いていたけど、最近実はブラウザでいいんじゃない? って機運を感じてきた。
アプリになった理由は単純で、初期のスマートフォンが性能足りなかったんですよね。
HTML5でアプリだ→いややっぱ無理だ……。って感じで。
で、最近のスマートフォンが性能足りないわけないし(とは言っても無限に性能は必要なんだが……)、徐々にWebの方が自由でいいのでは? となり始めたのではないかと……まだ気配しか感じてないけど。
ある種のロックインだったりプライバシーの問題だったりがあって、アプリだとどうしても囲い込まれるし不透明なところあるしで。
昨日Arcはいいぞ、と言ったばかりだが、Zen Browserも試して、最終的にはKagiの作っているOrionをしばらく使っていくことにした。
macOSで使っているが、現状完成度が一番高いのはArcでZen Browserもそこそこ、Orionもそこそこだけどエラーでクラッシュする頻度は高くてちょっとバギーな印象。
Appleでサインインすると落ちる、機能拡張入れると落ちる、みたいな感じで大分ロックなブラウザである。二回目やりなおすとうまく行くのだが。
このOrionの特徴は、ArcやZen Browserみたいに縦型タブが得意で(普通のタブ表示も出来るが)、PiP周りの挙動が同じような感じで……WebKitベースで作られている。
ArcはChromium(Blink)、ZenはFirefox(Servo)、OrionはWebKitの系統という感じ。エンジンとブラウザがごちゃついてる雑な分類になってしまうが。
SafariがWebKitなので、わりとmacOSネイティブっぽさを感じる出来である。
体感的にはmacOS環境だとWebKitの方が多少リソースの消費が軽い印象をもっている。とはいっても、こういうのは時期やら機能拡張やらで軽く変わりえるんだけど。
正直、このOrionブラウザ自体は結構趣味の品かなあ……というところなのだけれど、今後に期待してOrion+というプレミアムプランにしばらく入ってみるつもり。なお無料版と比較して、特典らしい特典はあまりない。
一方で、同じKagiが作っている、Kagi SearchというGoogleやBingやDuck Duck GoやEcosiaあたりのライバルになる検索エンジンについても利用を開始した。
こちらについてはまた後で記事を書きたい。