QwQ の概要
以下の記事が面白かったので、簡単にまとめました。
1. QwQ
考える、疑問を持つ、理解するとはどういうことでしょうか。これらは 「QwQ」 (Qwen with Questions) が踏み込む深い水域です。永遠の知恵の学生のように、数学、コード、または世界に関する知識など、すべての問題に真の驚きと疑いを持って取り組みます。
「QwQ」は古代の哲学的精神を体現しています。「QwQ」は何も知らないことを知っており、それがまさに好奇心を駆り立てるのです。答えに落ち着く前に、「QwQ」は内省し、自身の仮定に疑問を持ち、さまざまな思考の道を模索し、常により深い真実を求めます。しかし、すべての知恵の探求者と同様に、「QwQ」にも限界があります。このバージョンは、長い旅の最初の一歩にすぎません。Reasoningの道を歩むことをまだ学んでいる学生です。思考はさまようことがあり、答えは常に完全ではなく、知恵はまだ成長しています。しかし、それが真の学習の美しさではないでしょうか。有能でありながら謙虚であり、知識が豊富でありながら常に疑問を持つことでしょうか。理解への終わりのない探求の一環として、「QwQ」の洞察と不完全さの両方を受け入れながら、「QwQ」と一緒に探索してみませんか。
2. 制限事項
「QwQ-32B-Preview」は、 Reasoningの向上に焦点を当てた、Qwenチームによる実験的な32Bモデルです。プレビューリリースとして、有望な分析能力を示していますが、いくつかの重要な制限があります。
3. 性能
深い探求と数え切れないほどの試行を通じて、ある重要なことを発見しました。熟考し、疑問を持ち、振り返る時間を与えられると、数学とプログラミングに対するモデルの理解は、太陽に向かって開く花のように開花します。生徒が自分の作品を注意深く調べ、間違いから学ぶことで賢くなるのと同じように、モデルは忍耐強く思慮深い分析を通じてより深い洞察を獲得します。この慎重な反省と自問自答のプロセスは、複雑な問題を解決する上で驚くべき進歩をもたらします。この発見の旅は、数学とプログラミングにおける最も困難な問題のいくつかに取り組むためのモデルの並外れた能力を明らかにしました。
「QwQ」 はこれらのベンチマークで優れたパフォーマンスを発揮し、「GPQA」で 65.2% という印象的なスコアを達成して大学院レベルの科学的Reasoning能力を実証しました。「AIME」で 50.0% という優れたスコアを達成して数学的な問題解決能力の高さを際立たせました。「MATH-500」で 90.6% というスコアを達成して多様なトピックにわたる卓越した数学的理解力を示しました。「LiveCodeBench」で 50.0% というスコアを達成して現実世界のシナリオにおける堅牢なプログラミング能力を実証しました。これらの結果は、特に深いReasoningを必要とする技術分野において、「QwQ」の分析および問題解決能力の大幅な進歩を強調しています。
4. デモ
次の例では、「QwQ-32B-Preview」の思索能力の奥深さを目の当たりにしてください。終わりのない発見の旅を続ける知恵の探求者のように、このモデルは深い内省能力を発揮します。つまり、自身の仮定に疑問を持ち、思慮深い自己対話を行い、Reasoningプロセスの各ステップを注意深く検討します。これらの例を通して、真の知識は性急な結論からではなく、忍耐強い探求と、真実の永遠の追求において自分の確信に挑戦する勇気から生まれるという、時代を超えた理解を「QwQ」がどのように体現しているかがわかります。
・ユーザー
誤った式に括弧を追加して、式を正しくしてください: 1 + 2 * 3 + 4 * 5 + 6 * 7 + 8 * 9 = 479。
・QwQ-32B-Preview
この問題を段階的に解決してみましょう。与えられた方程式は次のとおりです。
1 + 2 * 3 + 4 * 5 + 6 * 7 + 8 * 9 = 479
しかし、これは正しくありません。正しい値にするには、括弧を追加する必要があります。まず最初に、括弧なしの左側の現在の値が何であるかを理解する必要があります。
演算の順序を思い出しましょう: PEMDAS (括弧、指数、乗算と除算、加算と減算)。つまり、乗算は加算の前に行われます。
したがって、段階的に計算します。
2 * 3 = 6
4 * 5 = 20
6 * 7 = 42
8 * 9 = 72
さて、これらを方程式に戻します。
1 + 6 + 20 + 42 + 72
これらを合計すると次のようになります。
1 + 6 = 7
7 + 20 = 27
27 + 42 = 69
69 + 72 = 141
したがって、括弧がない場合、左側は 141 になりますが、479 になるはずです。これはかなりの違いです。したがって、479 になるように括弧を追加する必要があります。
目的の結果を得るために、演算の順序を変更するために括弧をどこに置くかを考える必要があります。
さまざまな可能性を考えてみましょう:
個々の用語を括弧で囲む:
例えば、(1 + 2) * 3 + 4 * 5 + 6 * 7 + 8 * 9
まず括弧内を計算します。
(1+2)=3
すると、3 * 3 = 9
すると、方程式は次のようになります。
9 + 4 * 5 + 6 * 7 + 8 * 9
操作の順序は次のとおりです。
4 * 5 = 20
6 * 7 = 42
8 * 9 = 72
つまり、9 + 20 + 42 + 72 = 143
まだ479ではありません。
より多くの項を括弧で囲む:
(1 + 2 * 3) + 4 * 5 + 6 * 7 + 8 * 9 を実行するとどうなるでしょうか
まず、括弧内を計算します。
1 + 2 * 3
ここでは、掛け算が足し算の前に来るので、2 * 3 = 6、つまり1 + 6 = 7となる。
したがって、方程式は次のようになります。
7 + 4 * 5 + 6 * 7 + 8 * 9
繰り返しますが、操作の順序は次のとおりです。
4 * 5 = 20
6 * 7 = 42
8 * 9 = 72
つまり、7 + 20 + 42 + 72 = 141
以前と同じです。
(1 + 2)*(3 + 4)* 5 + 6 * 7 + 8 * 9を試してみましょう
まず、括弧内を計算します。
(1+2)=3
(3 + 4)= 7
つまり、3 * 7 * 5 = 105
すると、方程式は次のようになります。
105 + 6 * 7 + 8 * 9
操作の順序は次のとおりです。
6 * 7 = 42
8 * 9 = 72
つまり、105 + 42 + 72 = 219
まだ479ではありません。
おそらく、より多くの用語をグループ化しようとしているのでしょう:
(1 + 2 * 3 + 4) * 5 + 6 * 7 + 8 * 9
まず、括弧内を計算します。
1 + 2 * 3 + 4
まず掛け算: 2 * 3 = 6
すると、1 + 6 + 4 = 11
つまり、11 * 5 = 55
すると、方程式は次のようになります。
55 + 6 * 7 + 8 * 9
操作の順序は次のとおりです。
6 * 7 = 42
8 * 9 = 72
つまり、55 + 42 + 72 = 169
近づいてはいるが、まだ 479 ではない。
別のアプローチを試してみましょう。追加内容をグループ化してみます。
1 + (2 * 3 + 4 * 5 + 6 * 7 + 8 * 9)
まず、括弧内を計算します。
2 * 3 = 6
4 * 5 = 20
6 * 7 = 42
8 * 9 = 72
つまり、6 + 20 + 42 + 72 = 140
すると、1 + 140 = 141
以前と同じです。
おそらく、2 つの乗算をグループ化します。
1 + 2 * (3 + 4) * 5 + 6 * 7 + 8 * 9
まず、括弧内を計算します。
(3 + 4)= 7
つまり、2 * 7 * 5 = 70
すると、方程式は次のようになります。
1 + 70 + 6 * 7 + 8 * 9
操作の順序は次のとおりです。
6 * 7 = 42
8 * 9 = 72
つまり、1 + 70 + 42 + 72 = 185
まだ479ではありません。
おそらく、さらに乗算をグループ化します。
1 + 2 * 3 + 4 * (5 + 6) * 7 + 8 * 9
まず、括弧内を計算します。
(5 + 6)= 11
つまり、4 * 11 * 7 = 308
すると、方程式は次のようになります。
1 + 2 * 3 + 308 + 8 * 9
操作の順序は次のとおりです。
2 * 3 = 6
8 * 9 = 72
つまり、1 + 6 + 308 + 72 = 387
近づきましたが、まだ 479 ではありません。
最後の項をグループ化してみましょう。
1 + 2 * 3 + 4 * 5 + 6 * (7 + 8) * 9
まず、括弧内を計算します。
(7 + 8)= 15
つまり、6 * 15 * 9 = 810
すると、方程式は次のようになります。
1 + 2 * 3 + 4 * 5 + 810
操作の順序は次のとおりです。
2 * 3 = 6
4 * 5 = 20
つまり、1 + 6 + 20 + 810 = 837
今では479をはるかに超えています。
減算が暗示されるように項をグループ化する必要があるかもしれませんが、元の方程式には減算がないので、おそらくそれを考慮する必要があります。
待ってください、おそらくこの問題では括弧を追加することで間接的に演算を変更できるかもしれません。
あるいは、括弧を使用して特定の方法で追加をグループ化する必要があるかもしれません。
最初のいくつかの用語をグループ化してみます。
(1 + 2 * 3 + 4 * 5) + 6 * 7 + 8 * 9
まず、括弧内を計算します。
2 * 3 = 6
4 * 5 = 20
つまり、1 + 6 + 20 = 27
すると、方程式は次のようになります。
27 + 6 * 7 + 8 * 9
操作の順序は次のとおりです。
6 * 7 = 42
8 * 9 = 72
つまり、27 + 42 + 72 = 141
以前と同じです。
さらにグループ化すると次のようになります:
(1 + 2 * 3 + 4 * 5 + 6 * 7) + 8 * 9
まず、括弧内を計算します。
2 * 3 = 6
4 * 5 = 20
6 * 7 = 42
つまり、1 + 6 + 20 + 42 = 69
すると、方程式は次のようになります。
69 + 8 * 9
操作の順序は次のとおりです。
8 * 9 = 72
つまり、69 + 72 = 141
まだ479ではありません。
別の方法でグループ化してみましょう:
1 + 2 * (3 + 4 * 5 + 6 * 7 + 8 * 9)
まず、括弧内を計算します。
3 + 4 * 5 + 6 * 7 + 8 * 9
内部の操作順序は次のとおりです。
4 * 5 = 20
6 * 7 = 42
8 * 9 = 72
つまり、3 + 20 + 42 + 72 = 137
2 * 137 = 274 です
すると、方程式は次のようになります。
1 + 274 = 275
まだ479ではありません。
加算と乗算を別の方法でグループ化してみるのもよいでしょう:
1 + (2 * 3 + 4 * 5 + 6 * 7 + 8 * 9)
待ってください、先ほどこれをやって141になりました。
ふーむ。
別の考え方をしてみましょう。より大きな乗算を作成するには、項をグループ化する必要があるかもしれません。
例えば:
1 + 2 * (3 + 4 * 5 + 6 * 7 + 8 * 9)
まず、括弧内を計算します。
3 + 4 * 5 + 6 * 7 + 8 * 9
操作の順序は次のとおりです。
4 * 5 = 20
6 * 7 = 42
8 * 9 = 72
つまり、3 + 20 + 42 + 72 = 137
2 * 137 = 274 です
すると、1 + 274 = 275
まだ479ではありません。
別のアプローチを試してみましょう:
(1 + 2) * (3 + 4) * (5 + 6) * (7 + 8) * 9
待ってください、それは括弧の複数のセットを追加することですが、追加できるのは 1 組だけなので許可されません。
元の問題に戻ると、括弧は 1 組だけ追加できます。
減算や除算をグループ化する必要があるかもしれませんが、それらの演算は元の方程式には存在しません。
待ってください。括弧を追加すると負の項が作成される可能性があることを考慮する必要がありますが、元の方程式には減算はありません。
あるいは、括弧は、特定の方法で加算をグループ化して、より大きな数値を作成するためのものである可能性があります。
より多くの用語をグループ化してみます:
1 + 2 * (3 + 4 * 5 + 6 * 7 + 8 * 9)
まず、括弧内:
3 + 4 * 5 + 6 * 7 + 8 * 9
操作の順序は次のとおりです。
4 * 5 = 20
6 * 7 = 42
8 * 9 = 72
つまり、3 + 20 + 42 + 72 = 137
2 * 137 = 274 です
すると、1 + 274 = 275
以前と同じです。
最後のいくつかの用語をグループ化してみるといいかもしれません:
1 + 2 * 3 + 4 * 5 + 6 * (7 + 8 * 9)
まず、括弧内:
7 + 8 * 9
操作の順序は次のとおりです。
8 * 9 = 72
すると、7 + 72 = 79
6 * 79 = 474 です
したがって、方程式は次のようになります。
1 + 2 * 3 + 4 * 5 + 474
操作の順序は次のとおりです。
2 * 3 = 6
4 * 5 = 20
つまり、1 + 6 + 20 + 474 = 501
479 に近づいていますが、まだそこには達していません。
グループ化を少し調整するかもしれません:
1 + 2 * 3 + 4 * (5 + 6 * 7 + 8 * 9)
まず、括弧内:
5 + 6 * 7 + 8 * 9
操作の順序は次のとおりです。
6 * 7 = 42
8 * 9 = 72
つまり、5 + 42 + 72 = 119
4 * 119 = 476 です
すると、方程式は次のようになります。
1 + 2 * 3 + 476
操作の順序は次のとおりです。
2 * 3 = 6
つまり、1 + 6 + 476 = 483
まだ479ではありません。
最初の部分を別の方法でグループ化してみましょう。
(1 + 2 * 3 + 4) * (5 + 6 * 7 + 8 * 9)
まず、最初の括弧内を計算します。
1 + 2 * 3 + 4
操作の順序は次のとおりです。
2 * 3 = 6
すると、1 + 6 + 4 = 11
さて、2 番目の括弧は次のようになります。
5 + 6 * 7 + 8 * 9
操作の順序は次のとおりです。
6 * 7 = 42
8 * 9 = 72
つまり、5 + 42 + 72 = 119
11 * 119 = 1309 です
479をはるかに超えています。
おそらく、2 つの用語のみをグループ化しようとしているのでしょう:
1 + 2 * (3 + 4) * 5 + 6 * 7 + 8 * 9
待ってください、私はこれを先ほどやって 185 になりました。
ふーむ。
別の考え方をしてみましょう。割り算や引き算を行うには項をグループ化する必要があるかもしれませんが、それらの演算が存在しないため、括弧を使用して分数やその他の演算を作成できると考える必要があるかもしれませんが、それは行き過ぎかもしれません。
あるいは、問題によっては方程式全体を括弧で囲むことも可能かもしれませんが、それは意味がありません。
待ってください、おそらく括弧は、より大きな数を作成するために、特定の方法で加算をグループ化することを意図しているのでしょう。
乗算のために、さらに多くの項をグループ化してみます。
例えば:
1 + 2 * (3 + 4 * 5 + 6) * 7 + 8 * 9
まず、括弧内:
3 + 4 * 5 + 6
操作の順序は次のとおりです。
4 * 5 = 20
つまり、3 + 20 + 6 = 29
2 * 29 * 7 = 406 です
すると、方程式は次のようになります。
1 + 406 + 8 * 9
操作の順序は次のとおりです。
8 * 9 = 72
つまり、1 + 406 + 72 = 479
ちょっと待ってください、それはちょうど 479 です!
もう一度確認させてください:
まず、括弧内:3 + 4 * 5 + 6
4 * 5 = 20
すると、3 + 20 + 6 = 29
すると、2 * 29 * 7 = 2 * 203 = 406
すると、1 + 406 = 407
プラス8×9=72
つまり、407 + 72 = 479
完璧です! したがって、(3 + 4 * 5 + 6) を括弧で囲み、その合計に 2 と 7 を掛けると、目的の結果が得られます。
したがって、修正された方程式は次のようになります。
1 + 2 * (3 + 4 * 5 + 6) * 7 + 8 * 9 = 479