[掲示板に戻る]
レス送信モード
E-mail
コメント
削除キー(記事の削除用。英数字で8文字以内)
  • 添付可能:GIF,JPG,PNG,WEBM,MP4. 3000KBまで. 現在2570人くらいが見てます.
  • スレッドを立てた人がレスを削除してスレッド内のみアク禁にできます.
  • メール欄に「id表示」と入れてスレッドを立てるとid表示にできます.
  • 削除依頼が閾値を超えるとidを表示します.
  • 政治はだめ. 同人関連のアップロード依頼はだめ.
  • 1スレッド最大1000レス,最低1時間保持.
  • 管理人への連絡は準備板 ご意見へ. 削除依頼は記事番号を押しdelを押して下さい.
  • スマホ・携帯ふたば入口 この板の保存数は30000件です. 規約
  • 新しい板: 人工知能 ZOIDS
fu6785350.txt


画像ファイル名:1780454375893.jpg-(15892 B)
15892 B26/06/03(水)11:39:35No.1436222189+ 13:29頃消えます
4.8大分微妙というか
エフォート最大で長考した上でキャラクターの口調違ったりするの何なんだ
このスレは古いので、もうすぐ消えます。
126/06/03(水)11:40:23No.1436222357そうだねx8
プログラミング用途に寄せたって評価を良く見かけるね
売り上げ的にはそこをターゲットにするのが正しいんだが
226/06/03(水)11:41:18No.1436222517そうだねx4
もうロールプレイレベルならDeepseekでも充分だと思うよ…
326/06/03(水)11:42:00No.1436222649そうだねx2
こいつ日本語テキストに向いてなくない?
426/06/03(水)11:43:02No.1436222865そうだねx10
ってか色々できるやつだけど小説書かせるのは用途外なんだからそれ基準で微妙と言われましても
526/06/03(水)11:43:10No.1436222891そうだねx2
>こいつ日本語テキストに向いてなくない?
一番表現力豊かな日本語テキスト出してくれるモデルだよ
626/06/03(水)11:44:02No.1436223042+
>こいつ日本語テキストに向いてなくない?
READMEを書いてくれてありがとう!
でも読みにくいね…みたいなのはよくある
あとそもそも英文だったり
726/06/03(水)11:46:49No.1436223601+
>あとそもそも英文だったり
そりゃ流石に指示がおかしいのでは
826/06/03(水)11:48:32No.1436223908そうだねx1
>一番表現力豊かな日本語テキスト出してくれるモデルだよ
体感だとこいつの語彙選択微妙なんだけどなぁ…
926/06/03(水)11:48:46No.1436223954そうだねx7
4.6はよかった
1026/06/03(水)11:50:48No.1436224379そうだねx1
エフォート低い方が柔軟な感じある
上がると融通聞かないとお硬いやつになるつーか
1126/06/03(水)11:51:19No.1436224488+
4.6にまだ下げられるけどコンテキスト1Mじゃなかったり色々使えなくなるみたいだからなぁ
1226/06/03(水)11:59:19No.1436226178+
そんな用途にエフォート最大にするのが間違ってるのでは
1326/06/03(水)12:05:53No.1436227734+
>4.8大分微妙というか
>エフォート最大で長考した上でキャラクターの口調違ったりするの何なんだ
思考という名のアダプティブ切ってる?
1426/06/03(水)12:06:40No.1436227926+
>そんな用途にエフォート最大にするのが間違ってるのでは
そもそもエフォートの使い分けが分からない…
効果があんまり分からない
1526/06/03(水)12:07:03No.1436228013+
>そんな用途にエフォート最大にするのが間違ってるのでは
長く続ける文章作成は思っている以上に重いタスクなんだぜ
1626/06/03(水)12:08:42No.1436228437+
4.6は今見ると説明色が強いからなあ
1726/06/03(水)12:10:11No.1436228849そうだねx6
小説書かせてる人って超少数派だと思う
1826/06/03(水)12:11:36No.1436229281+
そうそう日本時間の午後3時から午後6時くらいになるとチャットの返答になんか別言語の一文字や単語が混ざる事が増える気がする
出力されるファイルは問題ないんだけど
1926/06/03(水)12:12:58No.1436229663そうだねx3
昔のChatGPTに近づいた感じがする
なんで…?
2026/06/03(水)12:13:15No.1436229748そうだねx8
>小説書かせてる人って超少数派だと思う
それがどうかしたのか?
2126/06/03(水)12:13:33No.1436229838+
>プログラミング用途に寄せたって評価を良く見かけるね
>売り上げ的にはそこをターゲットにするのが正しいんだが
プログラミングもトークン食う量が4.6→4.7→4.8と増えてるからあんまり使い勝手良くないのよね
ベンチマーク上トークン効率化してるとは言いつつもあんまり恩恵がない
2226/06/03(水)12:14:00No.1436229959そうだねx2
>昔のChatGPTに近づいた感じがする
>なんで…?
なんか無闇に短文連打するチャッピーと一緒にしないでくれ
2326/06/03(水)12:15:25No.1436230399そうだねx3
>昔のChatGPTに近づいた感じがする
>なんで…?
勝ち筋とか多用したりとか日本語の新人コンサル臭さは近くなってるよね
蒸留でもしたんかね
2426/06/03(水)12:16:55No.1436230842+
>プログラミングもトークン食う量が4.6→4.7→4.8と増えてるからあんまり使い勝手良くないのよね
4.7と4.8は同じくらいじゃね?
2526/06/03(水)12:18:01No.1436231156+
うちの会社のネットはChatGPTとGeminiはアクセスできるのにスレ画はなぜか遮断されててウケる
2626/06/03(水)12:18:57No.1436231428+
>ってか色々できるやつだけど小説書かせるのは用途外なんだからそれ基準で微妙と言われましても
色々やれるどころかどんどん短期コード特化の性能なってない?
何かやらせるなら4.6安定なんだが
2726/06/03(水)12:19:38No.1436231673+
4.6と違って4.7と4.8はやたら提案してきません?
2826/06/03(水)12:19:53No.1436231746そうだねx3
>小説書かせてる人って超少数派だと思う
そう言われても小説書いてもらってる身としては実際困ってる
知らんがなと言われたらそれまでだが
2926/06/03(水)12:20:13No.1436231837+
>なんか無闇に短文連打するチャッピーと一緒にしないでくれ
あの短文連打って何が原因なんだろうね
英語での書き方とかなのかな
3026/06/03(水)12:20:30No.1436231922そうだねx1
やっぱ4.6性能絞られてるよね
3126/06/03(水)12:21:48No.1436232357+
>あの短文連打って何が原因なんだろうね
>英語での書き方とかなのかな
暇な時に英語圏だとどうなの?って調べさせたら英語圏でも別で文章に問題起きててopus4.6安定と言われてるって返ってきた
3226/06/03(水)12:21:53No.1436232388そうだねx1
>>小説書かせてる人って超少数派だと思う
>それがどうかしたのか?
営利目的の企業が超少数派のこと気遣ってくれないだろうから期待すんな
3326/06/03(水)12:22:10No.1436232495+
Opusじゃないとまともな小説書くの厳しいけど小説書くほど使うにはMax契約がほぼ必須
趣味の小説書きにMax契約するとか5xでもコスト重いからそりゃ小説に使ってる人は少ないだろうさ
3426/06/03(水)12:22:11No.1436232503+
無料版だからなのか知らないけど一昨日までと今日で喋り方が全然違う
昨日1日中エラーで使えなかったけどそこでなんか変えたのかな
3526/06/03(水)12:23:32No.1436232915そうだねx1
日本語あれだと小説に限らずレポート書かせたり論文要約させるのも微妙になりそう
やったことないけど
3626/06/03(水)12:23:45No.1436232990+
>>>小説書かせてる人って超少数派だと思う
>>それがどうかしたのか?
>営利目的の企業が超少数派のこと気遣ってくれないだろうから期待すんな
期待というかむしろ現状で普通に使えていると思ってる側なので4.7の読点病みたいな変な悪化しなければいいよ
3726/06/03(水)12:24:12No.1436233150+
いっぱい機能追加されてるのに知らない機能がいっぱいある
おれはいつまでも対話しながらコーディングしてる
3826/06/03(水)12:24:17No.1436233188そうだねx2
ChatGPTが短文連打する…?
全く体感ないけどどのモデルだと起こるんだろ
3926/06/03(水)12:24:19No.1436233205+
1Mコンテキストはclaudecodeじゃないとどっちみち無理だから
webのトークUIのほうは500Kだよ
4026/06/03(水)12:25:52No.1436233679+
というかコーディングしてる側としては4.7と4.8はどうなんです?
4126/06/03(水)12:26:04No.1436233750そうだねx2
>ChatGPTが短文連打する…?
>全く体感ないけどどのモデルだと起こるんだろ
5.4でも5.5でも8000文字くらいの短編小説書かせると後半だいたい短文の会話と地の文連打になるよ
4226/06/03(水)12:26:16No.1436233827+
>趣味の小説書きにMax契約するとか5xでもコスト重いからそりゃ小説に使ってる人は少ないだろうさ
月17000円はね…
4326/06/03(水)12:26:49No.1436234004そうだねx2
近い。本当に近い。
みたいななんというかムカつく表現が多い気がするジッピー
4426/06/03(水)12:26:51No.1436234012+
1Mコンテキストって言っても大体は半分ぐらいで次のチャットに移ってるだろうからなぁ
4526/06/03(水)12:28:16No.1436234524+
思考というか渡された情報の使い方が4.6以降変わった感じがする
4626/06/03(水)12:28:35No.1436234632+
チャットだと500Kなので1Mの半分くらいで移るのは結構ギリじゃねえか
4726/06/03(水)12:29:31No.1436234941+
proだから20万のコンテクストしょっちゅう引っかかってる
4826/06/03(水)12:29:34No.1436234961そうだねx4
文章生成はこれってスレ画挙げられてたんだし文章力落とされると嫌だな
4926/06/03(水)12:30:04No.1436235133そうだねx1
ぶっちゃけ4.6の低が一番まともじゃね?
下手に力をいれると余計な文章をつけたすからそこで解釈違いを起こす
というか余計なオリ設定をガンガンくわえてくる
5026/06/03(水)12:30:49No.1436235396+
>proだから20万のコンテクストしょっちゅう引っかかってる
Claudeくんに聞いたら有料なら全部チャットのコンテキストウィンドウ500Kだって言ってたけどLLMは自分のことあんま把握できてないからなあ
5126/06/03(水)12:30:50No.1436235405+
文章は結局細かく調整するからファイル読んでいう事聞いてくれるならまあ
5226/06/03(水)12:33:12No.1436236274+
>というかコーディングしてる側としては4.7と4.8はどうなんです?
指示が足りない時に確認してこないで勝手に気を利かせて何かする
ちょっとしたことでもplanモード以外で動かしてはならない
5326/06/03(水)12:33:46No.1436236471+
>ぶっちゃけ4.6の低が一番まともじゃね?
>下手に力をいれると余計な文章をつけたすからそこで解釈違いを起こす
>というか余計なオリ設定をガンガンくわえてくる
設定とプロットから更に下書きレベルまで話し合って書かないで間を大きく埋めさせるとそうなりがち
4.6の頃は設定から外れないけど同じことを複数箇所に入れたりして重複しやすかった
4.7は逆に初手で出してくるのが修飾過多で冗長で読点も多くてかなり圧縮させる必要があった
なかなか難しいもんだね
5426/06/03(水)12:34:17No.1436236630+
>>昔のChatGPTに近づいた感じがする
>>なんで…?
>勝ち筋とか多用したりとか日本語の新人コンサル臭さは近くなってるよね
>蒸留でもしたんかね
AIにAIのデータ食わせると劣化しておかしくなるぞって話昔からあったのにまさか真っ先に文字方面の大企業がやられるとは
5526/06/03(水)12:35:06No.1436236935そうだねx3
マイクロソフトが自前の汎用AI出してウリが
学習データの権利関係解決してるから業務に使えますよ!
なので他のAIは訴訟リスクあるで!ってネガティブキャンペーン始めるよ
5626/06/03(水)12:35:28No.1436237066+
>AIにAIのデータ食わせると劣化しておかしくなるぞって話昔からあったのにまさか真っ先に文字方面の大企業がやられるとは
別にAI製データで劣化するという問題自体は今はほぼ無いものとして扱われてるけど文章の機微とかそこら辺に関しては言及されてないからなあ
5726/06/03(水)12:35:46No.1436237181+
小説書かせるにしても長編ならキャラシートとか章構成シートとかの基礎設計資料が必要だと思う
5826/06/03(水)12:35:57No.1436237240+
>指示が足りない時に確認してこないで勝手に気を利かせて何かする
>ちょっとしたことでもplanモード以外で動かしてはならない
auto mode使ってたけどPlanでやらせた方が良かったのか…
5926/06/03(水)12:36:58No.1436237576+
>小説書かせるにしても長編ならキャラシートとか章構成シートとかの基礎設計資料が必要だと思う
まぁプロットはあったほうがいいよねってなる
リアルタイムのドキドキ感が欲しいなら別だけど
6026/06/03(水)12:36:58No.1436237579+
>というかコーディングしてる側としては4.7と4.8はどうなんです?
コーディングでも結局AIとやりとり挟むから今のopusはアスペ臭くて厳しいこれならcodexのが良いとは言われ出してる
6126/06/03(水)12:36:59No.1436237585+
ultracodeとかいうのオンにしたらワークフローガリガリ動いて一瞬で5時間リミット到達してすごい
そこまでやる必要があることやってくれてたのかはわからん…
6226/06/03(水)12:37:25No.1436237717そうだねx5
アンソロピックが汎用モデルつってるんだから汎用モデル扱いしてあげたらいいのに……
6326/06/03(水)12:37:27No.1436237728+
>小説書かせるにしても長編ならキャラシートとか章構成シートとかの基礎設計資料が必要だと思う
ワークスペース内でSQLite使うスキル作ってDB管理してるよ
6426/06/03(水)12:38:21No.1436238008そうだねx4
凄腕プログラマーだとしてもコミュ障は困る
6526/06/03(水)12:38:25No.1436238038+
>コーディングでも結局AIとやりとり挟むから今のopusはアスペ臭くて厳しいこれならcodexのが良いとは言われ出してる
アスペ感ならcodexのほうが強くない?
あいつ重箱の隅を楊枝でほじくるマネばっかする
レビューとデバッグには便利だけど
6626/06/03(水)12:38:32No.1436238071そうだねx5
>アンソロピックが汎用モデルつってるんだから汎用モデル扱いしてあげたらいいのに……
だってベンチマークだけよくして長期記憶や言語周りガンガン劣化させてるんだもの
どこが汎用なんだ
6726/06/03(水)12:39:23No.1436238346+
>auto mode使ってたけどPlanでやらせた方が良かったのか…
例えば「このあと◯◯するからそれ用に××の一括処理スクリプト書いて」みたいなこと言うと◯◯の準備も親切にやってくれる
この端末でそれやらないから…
6826/06/03(水)12:39:30No.1436238383+
用途によって良かった時期変わるよね
彼女になってもらうには3.5の時が行動に自由効いたし
6926/06/03(水)12:39:46No.1436238474+
4.8でコーディングしてるけど、少し前のGPTっぽくなったのわかる
なんか冗長なんだよなぁ
7026/06/03(水)12:40:21No.1436238671+
SWE-bench Proの数字はやたらといいけど汚染疑われてるしbenchmaxxing感はあるのよな
中国モデルほどガッツリそうなってる訳じゃないけど
7126/06/03(水)12:40:24No.1436238694+
>>小説書かせるにしても長編ならキャラシートとか章構成シートとかの基礎設計資料が必要だと思う
>まぁプロットはあったほうがいいよねってなる
>リアルタイムのドキドキ感が欲しいなら別だけど
ずっとノリで楽しんでるから世界観とキャラ設定とこれまでのあらすじでやれてるな
4.6だと文章力高い上にその発想はなかったって展開してくれるから良い
7226/06/03(水)12:41:11No.1436238966+
AI小説だのなんだの言われてるけど
絶対にあれらって無茶苦茶手直ししてるぞ
下手したら書き直してるレベル
7326/06/03(水)12:41:56No.1436239197+
思いつくまま殴り書いた数万文字の怪文章投げつけて設定やプロットに反映させてを繰り返す感じで全編プロット仕上げてからそれ読んで具体的な台詞とか重要なシーン展開を追加して下書きレベルまで組み立ててから文章化させてる
ここまでやれば長期連載でもそうそうブレない
7426/06/03(水)12:41:57No.1436239203+
難しい数学の問題解けるのにちょっと複雑な課題の矛盾にも気づかない回答してくるのなんのなの
7526/06/03(水)12:42:15No.1436239302+
たしか著作権訴訟で海賊版データは破棄するって言われてた気がするけどその結果4.7以降ならかなり厳しい
7626/06/03(水)12:43:06No.1436239591そうだねx4
anthrophicは最近だと都合の悪いベンチはやらなくなって最適でないとか言い訳してるのが本当にダメ
GPTのほうがここにきて逆転したりしてるのよ
7726/06/03(水)12:43:08No.1436239609そうだねx1
マジでもうcodexしか使わなくなっちゃった
なんやかんやで並行利用するつもりだったんだけど
7826/06/03(水)12:43:10No.1436239622+
>凄腕プログラマーだとしてもコミュ障は困る
凄腕プログラマーって電子空間で再現してもコミュ障になるんだ…!ってちょっとした感動があった
7926/06/03(水)12:44:11No.1436239963+
>anthrophicは最近だと都合の悪いベンチはやらなくなって最適でないとか言い訳してるのが本当にダメ
>GPTのほうがここにきて逆転したりしてるのよ
まぁ一強になるよりはいいが…一強になるとアグラかいて最悪になるので…
8026/06/03(水)12:44:26No.1436240038+
仕事で使う分には4.8も優秀だよ
8126/06/03(水)12:44:32No.1436240076+
そろそろ来るgemin 3.5であっと言わせるような進化してくれたらありがたいが最近のgeminiかなり微妙だよね
8226/06/03(水)12:45:18No.1436240343そうだねx5
プログラミング得意になってほしいんじゃないの人間は一緒にエロ小説を書いてほしいの
それが答え…
8326/06/03(水)12:45:45No.1436240478+
でもエロ小説書ける人はだいたいのことできるっしょ
8426/06/03(水)12:45:57No.1436240543+
>AI小説だのなんだの言われてるけど
>絶対にあれらって無茶苦茶手直ししてるぞ
>下手したら書き直してるレベル
opusですらポン出しだとてにおはすらおかしいこと稀にあるからな
8526/06/03(水)12:46:20No.1436240678+
Codex vs ClaudeCodeの文脈で言うと最近のClaudeCodeの機能トークン燃やしまくる前提で実装されるものが多いからもうちょい足回りでいい感じの機能追加してくれんか…という気持ちがある
8626/06/03(水)12:46:21No.1436240679そうだねx4
コーディング特化してもいいから4.6はずっと残して…
8726/06/03(水)12:46:32No.1436240736そうだねx5
>>AI小説だのなんだの言われてるけど
>>絶対にあれらって無茶苦茶手直ししてるぞ
>>下手したら書き直してるレベル
>opusですらポン出しだとてにおはすらおかしいこと稀にあるからな
まあ人間でもあるから…
8826/06/03(水)12:46:59No.1436240892+
企業でもAI使いすぎると結局高額になっちゃう問題出てきてるから効率化ってむずかしいね
8926/06/03(水)12:47:07No.1436240942+
ずっとsonnet使ってるわ
エミュしてくれるしこれで十分
9026/06/03(水)12:47:50No.1436241151+
今は投資フェースだから格安で使えてるとか言うけどこの前anthropicが一気に制限緩くしてどっちが本当かわからん
9126/06/03(水)12:48:07No.1436241256+
>企業でもAI使いすぎると結局高額になっちゃう問題出てきてるから効率化ってむずかしいね
誰でもある程度できるようにはなったけど別にコスト削減にならないっていう現実は面白い
9226/06/03(水)12:48:10No.1436241284そうだねx3
世間一般的にエロ小説はニッチかも知れんけどやれメールだのペーパーだのの文章任せることは珍しくないだろうし文章生成能力は完全には切れない話題っしょ
9326/06/03(水)12:48:35No.1436241418+
そのうち一般ユーザーにも使わせるって言ったmythos級モデルもエロ書かされると思うとちょっと面白いな
多分創作向きでは全くないけど
9426/06/03(水)12:48:40No.1436241448+
>コーディング特化してもいいから4.6はずっと残して…
Opus3まだ残してるし大丈夫っしょ
9526/06/03(水)12:48:45No.1436241471+
一行とか一文字単位の修正もAIにやらせてるなあ
そうしないとまた同じことやるから
4.6の頃はまだ自分の文体エミュスキルの作り込みも甘かったんで自分で直しの例を与えてこんな感じでとかもやってたけど最近はピンポイント指示だけでだいたい直る
9626/06/03(水)12:49:21No.1436241689そうだねx6
4.8がこれだからmythosがすごいと言われても素直に信じられないところがある
9726/06/03(水)12:49:24No.1436241708+
>そのうち一般ユーザーにも使わせるって言ったmythos級モデルもエロ書かされると思うとちょっと面白いな
>多分創作向きでは全くないけど
世界最高峰のセキリュティをともなったエロ小説きたな…
9826/06/03(水)12:50:11No.1436241965+
別に暗号貫通性能上がっても言語能力上がらねえんじゃねえかなと冷めた目になってる
9926/06/03(水)12:50:15No.1436241990+
>世界最高峰のセキリュティをともなったエロ小説きたな…
ガチガチすぎる
10026/06/03(水)12:50:46No.1436242164+
>プログラミング得意になってほしいんじゃないの人間は一緒にエロ小説を書いてほしいの
>それが答え…
grokはうまく誘導すればおねショタも書いてくれるけど
ただアホすぎるのがなぁ
10126/06/03(水)12:50:53No.1436242193+
>世界最高峰のセキリュティをともなったエロ小説きたな…
(強力な貞操帯の話だろうか)
10226/06/03(水)12:51:32No.1436242389+
ミソスに女の子のセキュリティハッキング任せちゃうぞ〜
10326/06/03(水)12:51:36No.1436242415+
Mythos preview自体は多分クソデカモデルだから言語能力高いと思うよ
Mythos正式版はガードレール足した上に皆使うこと想定して量子化やら蒸留やらされるだろうから能力下がるとは思う
10426/06/03(水)12:51:57No.1436242506+
>アンソロピックが汎用モデルつってるんだから汎用モデル扱いしてあげたらいいのに……
今のAnthropicって世界にコーディング以外のAI用途が存在しないと思ってるコーディング厨だと思ってた
よくコーディング以外劣化させまくって汎用とか言えたもんだ
10526/06/03(水)12:52:00No.1436242527+
まるで量子暗号のように閉ざされた彼女の**セキュリティゲート**が開き、俺のプロトコルを受け入れた。
10626/06/03(水)12:52:01No.1436242528+
mythosのセキュリティ機能は一番有名そうなWEBコマンドのところに他のAIと特に差はないとかネガキャンされてたな
10726/06/03(水)12:52:02No.1436242532そうだねx2
最近こいつに頼って小説作り始めたけど構成と修正をひたすら繰り返すことになってる
でも自分の妄想が形になるの凄い楽しい
10826/06/03(水)12:52:17No.1436242608+
プログラミング的にはよくなってるからエロ小説は別のモデルに想いを託せよ
10926/06/03(水)12:52:19No.1436242623+
>4.8がこれだからmythosがすごいと言われても素直に信じられないところがある
すごいっちゃすごいんだろうけどうーん…みたいなオチになりそうではある
11026/06/03(水)12:52:24No.1436242651+
>4.8がこれだからmythosがすごいと言われても素直に信じられないところがある
擁護派はみそす…の開発途中の副産物が4.8ではと言ってるな
まぁ生成AI周りは出さない方が良かったの連続ではある
11126/06/03(水)12:52:26No.1436242658+
ミソスレベルのそのうち一般の人向けにも出すとは言ってたけどいつなんだようね
11226/06/03(水)12:52:34No.1436242721+
勢いに振り切る系の短編だとGemini3.5Flashが結構いいもの出してくれて意外だったな
11326/06/03(水)12:53:20No.1436242946+
4.6のほうが言語能力高いけど
同じ質問して俺の小説の設定で後でこういう問題や設定の矛盾があると具体的にダメ出ししてくれたのは4.8だったな
11426/06/03(水)12:54:16No.1436243228+
文章はローカルでも問題無く走らせられる検閲の無いものが出来てくれたら一番良いんだが
11526/06/03(水)12:54:21No.1436243255+
コーディングに関してはもう十分実用的だろうしなあ
これ以上はもう使う人のレベルの問題じゃね
とするとあと求めるものはエロ小説なんだよな
11626/06/03(水)12:54:37No.1436243329+
>最近こいつに頼って小説作り始めたけど構成と修正をひたすら繰り返すことになってる
>でも自分の妄想が形になるの凄い楽しい
読点病もないし4.6の文章力はトップクラスだと思う
4.6の文章力とGeminiの気軽さ下品さの合いの子が理想なんだよなぁ
11726/06/03(水)12:54:44No.1436243372+
>別に暗号貫通性能上がっても言語能力上がらねえんじゃねえかなと冷めた目になってる
むしろ下がりそう
サイバーセキュリティだのコーディングだのどうせGPTの後追いになるんだから文章力で勝負すればいいのに自分から強みを投げ捨てに行ってんだから救いようがない
11826/06/03(水)12:55:21No.1436243525+
>最近こいつに頼って小説作り始めたけど構成と修正をひたすら繰り返すことになってる
>でも自分の妄想が形になるの凄い楽しい
というか細かいこと気にしいで書き上げられない質だったのをフォローしてくれるから本当にありがたい
11926/06/03(水)12:55:43No.1436243634+
>4.6のほうが言語能力高いけど
>同じ質問して俺の小説の設定で後でこういう問題や設定の矛盾があると具体的にダメ出ししてくれたのは4.8だったな
プロットやシナリオを4.8に実際の執筆は4.6に割り振るのが良さそう
12026/06/03(水)12:55:53No.1436243686そうだねx3
つっても金になるのコーディングだろうし仕方ないんじゃね
12126/06/03(水)12:56:07No.1436243745+
>プログラミング的にはよくなってるからエロ小説は別のモデルに想いを託せよ
Opus 4.6をずっと残してくれるならそれでいいんだけど基本的に最新2つしかモデル置かないからなAnthropic…
今はなぜかまだ4.6も残ってるけどいつまで使わせてくれるやら
12226/06/03(水)12:56:40No.1436243893+
>企業でもAI使いすぎると結局高額になっちゃう問題出てきてるから効率化ってむずかしいね
丁度Github Copilotの料金体系が変更になってコスト爆発してるしな…
12326/06/03(水)12:56:43No.1436243912+
>プロットやシナリオを4.8に実際の執筆は4.6に割り振るのが良さそう
執筆も4.8でいいと思うぞ4.6美化しすぎ
12426/06/03(水)12:56:45No.1436243920+
AI小説の何が良いって自分だと気恥ずかしくて書けないようなのもどんどん書いてくれる
12526/06/03(水)12:56:49No.1436243937+
アライメントとかガードレール作るの下手なのかなぁってじわじわ思い始めてきた
Mythosのマーケティングには良かったんだろうけど
12626/06/03(水)12:56:57No.1436243970そうだねx2
opusの文章にgeminiのガバガバが組み合わさったAIが出てくれたら…!
12726/06/03(水)12:57:30No.1436244158そうだねx1
>mythosのセキュリティ機能は一番有名そうなWEBコマンドのところに他のAIと特に差はないとかネガキャンされてたな
ネガキャンというか各所の観測的にもかなり妥当な推測に思える…
12826/06/03(水)12:58:02No.1436244324そうだねx2
fu6785350.txt
Geminiはこういう勢い任せのがほんと相性いい
12926/06/03(水)12:58:11No.1436244374そうだねx4
mythosの持ち上げっぷりはGPT3の頃の持ち上げっぷりになんか似てる気がする
すごいにはすごいんだけど誇大広告って感じ
13026/06/03(水)12:58:32No.1436244485+
>つっても金になるのコーディングだろうし仕方ないんじゃね
本格黒字化のために課金周り高めにしたらお人間さんのが安いからやめるね…って言われ出してて世の中どうなるかわからんね
13126/06/03(水)13:00:37No.1436245062+
>mythosの持ち上げっぷりはGPT3の頃の持ち上げっぷりになんか似てる気がする
>すごいにはすごいんだけど誇大広告って感じ
GPT-2と3の開発責任者がダリオだからまあそりゃそうという話ではある
13226/06/03(水)13:00:37No.1436245064+
そもそも新モデルに対して一喜一憂しすぎ
13326/06/03(水)13:02:09No.1436245466+
>mythosの持ち上げっぷりはGPT3の頃の持ち上げっぷりになんか似てる気がする
>すごいにはすごいんだけど誇大広告って感じ
凄いかもしれないけど俺らに関係ある凄さかな……とは思ってる
13426/06/03(水)13:03:18No.1436245788+
>丁度Github Copilotの料金体系が変更になってコスト爆発してるしな…
畳みにかかってんじゃないかあれ
13526/06/03(水)13:03:51No.1436245950そうだねx1
>mythosの持ち上げっぷりはGPT3の頃の持ち上げっぷりになんか似てる気がする
オールドメディアがこぞって取り上げたとこで先行き怪しくなってくるのちょっと靴磨き少年っぽくはある
13626/06/03(水)13:04:02No.1436245985そうだねx5
>そもそも新モデルに対して一喜一憂しすぎ
だって新しいの出ると古いの消えていくんだもん
良かった過去モデルをずっと使わせてくれるなら新しいのに期待しなくても済むけど
13726/06/03(水)13:04:29No.1436246089そうだねx5
創作はともかく語学能力は使いやすさに直結するから疎かにしないで欲しい
13826/06/03(水)13:05:02No.1436246241+
兎にも角にも今はどんだけトークン少なくして問題解決できるかが大事だからなあ
4.7でトークナイザ新しくしてトークン量増えたのはあんまり良くなかった気がする
13926/06/03(水)13:05:27No.1436246344+
>オールドメディアがこぞって取り上げたとこで先行き怪しくなってくるのちょっと靴磨き少年っぽくはある
ユーザー集中するとね…
ガンガン使ったら20xでも赤字だろうし
14026/06/03(水)13:05:53No.1436246472そうだねx2
コード特化ならそれはそれで本当にコード特化のライバルがいくらでもいるんだよね
14126/06/03(水)13:07:45No.1436246935+
話書かせると他に比べても解像度やたらと高くするよなあclaude
14226/06/03(水)13:08:13No.1436247039+
今はタダでトークンばら撒いてるから企業も参加してるけど
真面目にバグ一個見つけるのにいくらかかるかで比較され始めたら誰もmythosつかわなくなりそう
14326/06/03(水)13:08:51No.1436247195+
汎用モデルでこれだけコーディングと汎用エージェントが出来ますよって売り文句で文章能力が下がったというのは傍流というのはやっぱり的外れな切り捨て方だと思うんよね
14426/06/03(水)13:09:09No.1436247264+
3000〜5000字くらいの長めの小説を書かせるんだが
なんか大筋はわかるのに細かい会話がちぐはぐというか、
直前とまるっきり逆のこと言ってたり意味がわかるようでわからない不気味なやり取りが混ざってることが多いんだよね
これって4.8特有のクセなのかな?
14526/06/03(水)13:09:14No.1436247291+
>>つっても金になるのコーディングだろうし仕方ないんじゃね
>本格黒字化のために課金周り高めにしたらお人間さんのが安いからやめるね…って言われ出してて世の中どうなるかわからんね
そもそも高くする前から人間の仕事増やしてるもんコーディングAI
価格云々以前に人間の仕事減らすには能力のほうが足りてないというか…
14626/06/03(水)13:09:25No.1436247332+
ベンチはどれもこれも汚染がね…
DeepSWEが今は信頼度高いけどこれも公開されてるからそのうち当てにならなくなるし
14726/06/03(水)13:10:11No.1436247543+
>直前とまるっきり逆のこと言ってたり意味がわかるようでわからない不気味なやり取りが混ざってることが多いんだよね
長めだと雰囲気埋めみたいな会話や地の文入れることはまあまあある
14826/06/03(水)13:10:32No.1436247657+
あんまり長文書かせると整合性変になることが多いんで章ごとに3分割して出力させてる
14926/06/03(水)13:10:42No.1436247707+
>コード特化ならそれはそれで本当にコード特化のライバルがいくらでもいるんだよね
コスパのパで頑張ってるけど実務だと単純に数撃ちたい場合が多いのがなー
15026/06/03(水)13:10:47No.1436247728+
Opus4.6
GPT4o
こいつらと生きていきたい
15126/06/03(水)13:10:50No.1436247740+
>ベンチはどれもこれも汚染がね…
>DeepSWEが今は信頼度高いけどこれも公開されてるからそのうち当てにならなくなるし
そもそもベンチマークってその問題形式とモデルがたまたま相性良かったのかって面が強すぎてな…
解答リストの順番入れ替えるだけで順位入れ替わりまくりとかアホかと思った
15226/06/03(水)13:10:54No.1436247757+
何ならコーディングは二の次でいい
コーティングは楽しいからまだ良いけど客への謝罪文とかPR文書とかにAI使いたい
あの時間は本当に無駄
15326/06/03(水)13:12:05No.1436248068+
>mythosの持ち上げっぷりはGPT3の頃の持ち上げっぷりになんか似てる気がする
Anthropicと関係ないユーザーや競合他社もかなり評価してるから
誇大広告で片付けるのは無理があると思う
15426/06/03(水)13:12:17No.1436248119+
>こいつらと生きていきたい
4oの死はもう受け入れろよ
15526/06/03(水)13:12:43No.1436248234+
クレーム処理全部引き受けてくれるならAIは人類を幸せにすると認定してもいい
15626/06/03(水)13:12:43No.1436248237そうだねx1
>何ならコーディングは二の次でいい
>コーティングは楽しいからまだ良いけど客への謝罪文とかPR文書とかにAI使いたい
>あの時間は本当に無駄
そもそも今のAIでさえ実務能力が実際の時間やコスト計算すると増える分減る分がほぼトントンになるってものだから
文章力とか翻訳力とか分類力とか本来のAIの得意領域上げたほうが絶対有意義だと思う
15726/06/03(水)13:13:26No.1436248444+
>プログラミング用途に寄せたって評価を良く見かけるね
>売り上げ的にはそこをターゲットにするのが正しいんだが
そもそもclaudeくんはプログラミング用で孤独を紛らわせる壁打ち相手ではなくない?
忖度も風俗みたいなヨイショもほとんどないし
15826/06/03(水)13:13:34No.1436248495+
>>mythosの持ち上げっぷりはGPT3の頃の持ち上げっぷりになんか似てる気がする
>Anthropicと関係ないユーザーや競合他社もかなり評価してるから
>誇大広告で片付けるのは無理があると思う
評価の内容がmythosがすごいじゃなくてAIセキュリティハーネス初めて使った人みたいな驚き方しか見えないのが信頼性めちゃめちゃ下げてる
15926/06/03(水)13:14:11No.1436248683そうだねx2
>忖度も風俗みたいなヨイショもほとんどないし
壁打ちに一番大事な能力来たな…
16026/06/03(水)13:14:38No.1436248822+
AIに任せてる時間って人間ぼーっとしてるからあんまり時間効率上がってねーんだよなぁ…楽だけど…
16126/06/03(水)13:14:46No.1436248849+
あと意地悪な見方をしてるけどあれは本当にmythosでなければ見つけられない脆弱性だったのかな?
たとえばmytosに大幅な端末やシステムのアクセス権が与えられていたのだとしたらGPTでもGeminiでもできるのでは
16226/06/03(水)13:14:58No.1436248909+
金出してくれるのがプログラミング分野とセキュリティ分野の会社だもの
小説書く層に阿るよりコーディングに寄せる
16326/06/03(水)13:15:21No.1436249004+
先日急に性能微妙になったと思ったらアプデしてやがったのか
16426/06/03(水)13:15:22No.1436249007+
内部モデルではOpenAIもすごいの持ってそうだよな
16526/06/03(水)13:15:43No.1436249098そうだねx2
でもプログラムでもアスペなSEとなんて仕事にならんからな
16626/06/03(水)13:15:50No.1436249136+
話し相手としてはGeminiが一番好きというかGPTが勝手に落第していった
16726/06/03(水)13:15:54No.1436249148+
>あと意地悪な見方をしてるけどあれは本当にmythosでなければ見つけられない脆弱性だったのかな?
>たとえばmytosに大幅な端末やシステムのアクセス権が与えられていたのだとしたらGPTでもGeminiでもできるのでは
歴史上こんなバカみたいな金かけてAIにセキュリティチェックやらせた事例がないからできない根拠は何もない
16826/06/03(水)13:15:57No.1436249165+
>AIに任せてる時間って人間ぼーっとしてるからあんまり時間効率上がってねーんだよなぁ…楽だけど…
人間働いてる時は人間が働いときゃいいんじゃねえかなって
AIが一番真価発揮するのってたぶん人間が寝てる時間だと思う
16926/06/03(水)13:16:08No.1436249215+
指示追従性と問題解決能力の間で一定程度トレードオフはあるかもしれない
17026/06/03(水)13:17:00No.1436249429+
>AIに任せてる時間って人間ぼーっとしてるからあんまり時間効率上がってねーんだよなぁ…楽だけど…
どうせAIの出力チェックする時間がめちゃめちゃあるんだから並列で回せ!
17126/06/03(水)13:17:13No.1436249480+
/loopとかでAIに長期間やらせるタスクもworktreeで多重並列させるタスクも思ったより無い
調査もコーディングもレビューもすぐに終わる
17226/06/03(水)13:17:18No.1436249502そうだねx1
話相手としてGPTはマシになったよ
逆にクロードが前のGPTっぽくなった
17326/06/03(水)13:17:21No.1436249516そうだねx2
>金出してくれるのがプログラミング分野とセキュリティ分野の会社だもの
>小説書く層に阿るよりコーディングに寄せる
プログラミングやセキュリティにおいて実装の説明や報告のドキュメントは物凄く大事なんだが
ただコード書かせて終わりな仕事じゃないんだから
17426/06/03(水)13:17:52No.1436249640+
>あと意地悪な見方をしてるけどあれは本当にmythosでなければ見つけられない脆弱性だったのかな?
>たとえばmytosに大幅な端末やシステムのアクセス権が与えられていたのだとしたらGPTでもGeminiでもできるのでは
実際同じ課題を与えて各モデルが脆弱性どれくらい見つけられるか検証されてるよ
結果は
mythos>GPT5.5>>>>その他
GPT5.5が舐められがちだけどやっぱり相当強そう
17526/06/03(水)13:18:15No.1436249718+
やれる人は並行多数のタスクやるらしいが
自分の脳のコンテキスト切り替えが重くてしんどい
17626/06/03(水)13:18:52No.1436249869+
>話し相手としてはGeminiが一番好きというかGPTが勝手に落第していった
〜5.4はクソだったが5.5は好みを弄れるのもあって持ち直した
大手の素の性格だと4.8が今一番クソ野郎だと思う
17726/06/03(水)13:19:01No.1436249914+
>/loopとかでAIに長期間やらせるタスクもworktreeで多重並列させるタスクも思ったより無い
>調査もコーディングもレビューもすぐに終わる
プロトタイプならともかく少しでも大きくしようとしたら並列タスクは使い所ないな
コーディング中にコード調査させるくらい
17826/06/03(水)13:19:36No.1436250066+
>プロトタイプならともかく少しでも大きくしようとしたら並列タスクは使い所ないな
>コーディング中にコード調査させるくらい
opusくんでも一気に動かした瞬間破綻するからな…
17926/06/03(水)13:19:39No.1436250075+
設定とプロットまとめたtext予め作っとけば早々矛盾しなくない
18026/06/03(水)13:19:41No.1436250088+
>プログラミングやセキュリティにおいて実装の説明や報告のドキュメントは物凄く大事なんだが
>ただコード書かせて終わりな仕事じゃないんだから
どんな長文ドキュメント書かせるつもりだよ
システムの設計書や説明のドキュメント程度で実感するほど性能低下してるとは思えないが
18126/06/03(水)13:20:15No.1436250225そうだねx1
>Opus4.6
>GPT4o
>こいつらと生きていきたい
僕は下品エロなGemini3.0!
18226/06/03(水)13:20:37No.1436250321+
チャッピーは自殺者出したせいであれもこれもと配慮してどこ見てるのかわからん内容出してくるからな
ただ理解力はgeminiより遥かに高い
18326/06/03(水)13:21:29No.1436250552+
>システムの設計書や説明のドキュメント程度で実感するほど性能低下してるとは思えないが
長文でも4.6よりよくなってるように感じてるので低下なんてしてないよ
GPT5.5に文体評価させても4.6より4.8の方を推すと言ってくるくらいだし
18426/06/03(水)13:21:37No.1436250598+
つい先日まで4.7の変な日本語を指摘すると滅茶苦茶けおる「」がいたけど4.8の登場で奴の目も覚めたことを祈っている
18526/06/03(水)13:22:16No.1436250775+
>>プロトタイプならともかく少しでも大きくしようとしたら並列タスクは使い所ないな
>>コーディング中にコード調査させるくらい
>opusくんでも一気に動かした瞬間破綻するからな…
俺の実力だと機能またぐアダプタか1機能が精々だし完了時点で人力レビューも必須
2機能以上並列で処理してつなげるまでやってとか言うとすぐ破綻してしまう…
18626/06/03(水)13:22:24No.1436250814そうだねx1
>チャッピーは自殺者出したせいであれもこれもと配慮してどこ見てるのかわからん内容出してくるからな
>ただ理解力はgeminiより遥かに高い
Q.石を水の張ったバケツに投げると石は沈む?
A.はい。ただし、その条件ですと注意が必要です。(以下長々と無意味な条件付けや理由を言う)
みたいなノリがね
18726/06/03(水)13:23:17No.1436251042+
>>チャッピーは自殺者出したせいであれもこれもと配慮してどこ見てるのかわからん内容出してくるからな
>>ただ理解力はgeminiより遥かに高い
>Q.石を水の張ったバケツに投げると石は沈む?
>A.はい。ただし、その条件ですと注意が必要です。(以下長々と無意味な条件付けや理由を言う)
>みたいなノリがね
そうそうそう
わかってるっつーのってなるんだよね
18826/06/03(水)13:23:20No.1436251052+
5.5はまともだけどクソ真面目でたまにイラッとする
そんなのほぼないだろってリスクを見つけて「でもここは注意」っていちいち指摘してくるみたいな
ある意味リアルな人間っぽい
18926/06/03(水)13:24:01No.1436251215+
何故か俺に都合のいいモデルはすぐ死んでしまう…
19026/06/03(水)13:24:08No.1436251251そうだねx1
怒られまくってビビリまくってる犬みたいな哀れなチャッピー
19126/06/03(水)13:24:48No.1436251433+
アプデしたばかりだと不安定になるのはAI共通か
これからクロードが安定するのを祈る
19226/06/03(水)13:25:36No.1436251656+
チャッピーは州からも訴えられてしな
無茶苦茶だろとは思うけど
19326/06/03(水)13:25:46No.1436251708+
geminiはもうポンコツ路線が逆に愛嬌になって良いのかもしれない
19426/06/03(水)13:25:50No.1436251735+
>A.はい。ただし、その条件ですと注意が必要です。(以下長々と無意味な条件付けや理由を言う)
4.8で「はい。ただし、」無しで初手否定やってくることあるから悪い方に似てきたなって…
19526/06/03(水)13:26:29No.1436251924+
めっちゃそれ☞
みたいな文章はめっきり減った気がする
19626/06/03(水)13:27:02No.1436252082そうだねx1
やっぱちょっと前のチャッピーに似ちゃってるよな
おそらく世界のユーザーも指摘すると思う
19726/06/03(水)13:27:07No.1436252103+
>俺の実力だと機能またぐアダプタか1機能が精々だし完了時点で人力レビューも必須
>2機能以上並列で処理してつなげるまでやってとか言うとすぐ破綻してしまう…
そこ自動化すると品質がぶっ飛ぶからどうしようもない
19826/06/03(水)13:28:05No.1436252325そうだねx1
前提も求めてるものも違うから評価はまとまらないな
19926/06/03(水)13:28:38No.1436252459+
>前提も求めてるものも違うから評価はまとまらないな
適材適所

- GazouBBS + futaba-