banner
ニュース センター
専門的な知識を身につけており、有能です。

証拠の変化によって示される学習の複数のタイムスケール

May 05, 2023

npj 学習の科学 第 8 巻、記事番号: 19 (2023) この記事を引用

64 アクセス

メトリクスの詳細

証拠蓄積モデルにより、意思決定に関する理解は大幅に進歩しましたが、学習の検証への応用は一般的ではありませんでした。 4 日間にわたる動的なランダムなドット動きの方向識別タスクを完了した参加者からのデータを使用して、知覚的意思決定の 2 つの要素 (ドリフト拡散モデルのドリフト率と応答境界) の変化を特徴付けました。 連続時間学習モデルは、さまざまなダイナミクスを考慮したさまざまなモデルを使用して、パフォーマンス変化の軌跡を特徴付けるために適用されました。 最適なモデルには、累積試行数の連続的な指数関数として変化するドリフト レートが含まれていました。 対照的に、反応境界は毎日のセッション内で変化しましたが、毎日のセッション全体では独立して変化しました。 私たちの結果は、学習軌跡全体にわたって観察された行動パターンの根底にある 2 つの異なるプロセスを浮き彫りにしています。1 つは知覚感度の継続的な調整に関係し、もう 1 つは、行動するのに十分な証拠が存在するときの参加者の閾値を記述する、より可変的なプロセスです。

学習は、複雑な認知タスクや運動タスクから基本的な知覚識別に至るまで、人間が実行するほぼすべての行動で発生します。 したがって、学習に関与するプロセスを理解することは、教育からリハビリテーションに至るまで、人間のほとんどの行動に影響を及ぼします1,2。 驚くべきことに、学習プロセスに関する研究は多くの場合、いくつかの点で制限される傾向があります。 まず、学習に関する研究では、選択肢の正確性や同一性 3、4、または選択にかかる時間 (つまり、応答時間や RT 5、6) のいずれかのみに焦点を当てるのが非常に一般的です。 これは、意思決定の速度とその精度の両方を組み合わせて考慮すると、当面のプロセスに関するより豊富な推論が可能になることを示している膨大な研究にもかかわらず、です7、8、9、10。 第 2 に、学習研究において RT と精度の両方が考慮される限られたケースでは、モデリングにはほとんどの場合、参加者および/または学習トライアルにわたる実質的な集計が含まれます。 多くの場合、個別の定常モデルが個々の学習セッションまたは試行の「ブロック」からのすべての試行に適合され、セッションごと (またはブロックごと) のモデル パラメーターの違いを通じて学習が検査されます。 このような集計は、根底にある学習プロセスに関する推論の見逃しや誤った推論につながる可能性があるため、理論的にも経験的にも賢明ではない可能性があることが研究によって示されているにもかかわらず、依然として一般的です11、12、13。 以下では、(A) RT と精度をリンクするためのモデリング アプローチと、知覚領域での学習の評価におけるそれらの以前の使用方法、(B) 知覚領域での学習を評価するための連続時間アプローチと個人参加者のアプローチを簡単にレビューします。これら 2 つのアプローチを 1 つのフレームワークに組み合わせる必要性が生じています。 この組み合わせたアプローチにより、知覚的意思決定プロセスの特定の側面(たとえば、知覚的証拠がどれだけ早く蓄積されるか、反応を引き起こす前にどれだけの証拠が必要か)がマルチセッションで時間の経過とともにどのように変化するかに関する主要な質問に対処することができます。知覚学習の研究。

RT と離散的選択 (精度など) を結び付ける最も有名なモデルは、決定境界に達するまでのノイズの多い証拠の蓄積の結果として行動を概念化します 7、9、10、14。 たとえば、参加者が移動するドットのフィールドを表示するタスクを考えてみましょう (補足図 1 を参照)。 各試行では、ドットの 15% が左または右に一貫して移動し、残りのドットはランダムに移動します。 参加者の課題は、できるだけ早く正確に、一貫して動いているドットが左に動いているのか、右に動いているのかを示すことです。 アキュムレータ モデリング アプローチの下では、知覚システムは、選択肢の 1 つを支持する証拠の量が一定の境界に達するまで、それぞれの選択肢 (左または右) を支持する証拠を継続的に蓄積し、その時点で所定の決定が行われます。 このモデルは、有界ウィナー拡散過程によって正式に定義されます9,10。 結果として得られるドリフト拡散モデル (DDM) は、4 つのパラメーターによって特徴付けられます (図 1 を参照)。 2 つの代替強制選択では、証拠はバイアス ポイントで蓄積を開始し、境界に到達するまで一定のノイズとドリフト レート (DR) で進行します。境界間の距離は応答境界 (RB) パラメーターによって定義されます。 最後のパラメータは、証拠蓄積プロセス (非決定時間、NDT) とは理論的に独立した RT への加算値です。 階層ベイジアン法を使用してこれらのパラメーターを推定することはますます一般的になり、DDM パラメーター推定は、結合 RT および精度分布に適合する一般化混合効果回帰として定式化されます 8、15、16。 ここでは、Stan17、18、19 を使用して同様のメソッドを実装します。

意思決定プロセスは、応答境界とも呼ばれる下限または上限への何らかの平均値またはドリフト率を伴う、ノイズの多い証拠の蓄積 (灰色の線で示される 3 つの例) によって定義されます。 証拠の蓄積は、あるバイアス点 (通常、応答境界の割合として表されます) で始まり、追加の非決定時間パラメーターによって、証拠の蓄積プロセスに起因しない RT 分布の側面が考慮されます。

DDM パラメータは理論的には意思決定プロセスの心理的要素と関連付けられています (ただし、DDM パラメータとプロセスの間の経験的同型性については頻繁に議論があることに注意してください 7,20 が、参考文献 21 を参照してください)。 知覚能力の良し悪しに関連するような敏感さは、一般に DR に関連します。 一般に、RB には応答の注意、または「速度と精度のトレードオフ」が関連付けられています。 本研究では、DR と RB のみが時間の経過とともに変化するものとしてモデル化され、バイアスと NDT は参加者内で時間の経過とともに一定に保たれました。 戦略が実験的に操作されるとバイアスと NDT パラメータが変化することが示されており 20,22、一部の知覚学習タスク中に NDT の変動性が減少することが見られているが 23、推論につながる推定方法にはトレードオフがあることも知られています。真の分布の差が DR や RB14 などの他のパラメータによるものである場合の NDT の差。 これを考慮して、バイアスと NDT は各参加者に対して定数として推定され、DR と RB のみが指数学習関数 \({\boldsymbol{asymptote}}{\boldsymbol{+}}{\) に従って時間変化するとみなされました。ボールドシンボル{(}}{\boldsymbol{スタート}}{\boldsymbol{-}}{\boldsymbol{漸近線}}{\boldsymbol{)}}{\boldsymbol{* }}{{\boldsymbol{2}}}^ {{\boldsymbol{trialNumber}}{\boldsymbol{/}}{\boldsymbol{rate}}}\) 方法と補足説明を参照。 3、5、24。

DDM パラメータと迅速な意思決定プロセスの心理的要素との間に推定上の関連性があることを考えると、そのようなモデルは研究のほとんどの関連サブドメインにわたって顕著であると期待されるかもしれません。 ただし、必ずしもそうとは限りません。 たとえば、知覚学習25は、神経可塑性の基礎科学を研究するための重要な領域であるだけでなく、多くのリハビリテーションや職業上の応用にも関与しています1、26、27、28、29、30。 知覚学習領域では、圧倒的多数の研究が知覚的意思決定の個別の選択結果を調査しています。 これは、RT のような重要な行動変数を無視することは非効率的であり、パフォーマンスの変化の推定に偏りがある可能性があるため誤解を招く可能性さえあるという事実にもかかわらずです31。

少数の論文が、知覚的意思決定タスクにおける学習の DDM 分析の調査を報告しています。 しかし、さまざまなタイムスケールで特定のパラメーターがどの程度変化するかを確立する結果は特に重要ですが、依然としてまれです。 サルが眼球運動反応を伴って視覚識別課題を完了した初期の例では、DR の変化が学習関連のパフォーマンスの向上に関連していることが判明しました 32。 人間の知覚学習研究では、トレーニングに関連した DR の変化に関して同様の証拠が提供されています 23,31。

DDM フレームワークを利用した他のタスク操作では、さまざまなタイプの命令が学習の過程でパラメーター推定にどの程度影響するかを調査しました。 たとえば、学習者に知覚学習の速度または精度のいずれかを強調するよう明示的に指示した場合、その効果は、セッション間の DR、RB、NDT20 の変動を考慮した DDM モデルによって最もよく特徴付けられました。 全体的な NDT は時間の経過とともに確実に変化しませんでしたが、RB の減少と DR の増加を示す学習 (セッションレベルのパラメーターの比較) の主な効果がありました。 より短いタイムスケールの研究 33 では、24 の短いブロック (それぞれ約 1 分) にわたって、報酬率の計算によれば、参加者の RB は最適なレベルに収束する傾向がありました。 この後者の結果は、一般的に知覚学習に関連付けするには短すぎるタイムスケールで、測定可能な急速な変化が RB で発生する可能性があること、および学習を測定するために大きなブロックを集約する標準的な方法を使用する場合には短すぎるため測定できないことを示しています。

学習の普及モデルは、機能的神経画像処理などの他の手段と組み合わせて使用​​されてきました。 点運動方向弁別トレーニングに関するそのような研究の1つでは、トレーニング刺激DRの特異的な増加が観察され、補助眼野と腹側運動前野のfMRI活性化に関連していましたが、RBの非特異的な増加も観察され、モデルの比較は行われませんでした。 NDT34 のトレーニング関連の変更をサポートします。 別の研究では、認知トレーニングは DR の増加と RB の減少につながりましたが、DDM コンポーネントのトレーニングに関連した変化と神経測定との間の唯一の関連性は、RB の変化と線条体活動の変化との間の関連でした 35,36。 このように、DDM パラメータと神経変化の関係は、学習の認知神経科学のための強力なツールとなる可能性があることは明らかですが、DDM パラメータに対する経験の影響に関する基礎研究が相対的に不足していることは、そのような対応関係のテストが依然として制約がほとんどないことを意味します。 。

全体として、DDM を使用した知覚学習に関するこれまでの調査では、そのような学習中に発生する変化のメカニズムを理解するための証拠蓄積モデルの有用性が示されています。 これらの研究分野の潜在的な大きな限界の 1 つは、パフォーマンスと学習の時間経過に関する特定の暗黙の仮定を必然的に具体化する分析手法を利用していることです。 具体的には、DR と RB の両方の変化の評価には、データの完全なブロックまたはセッションに適合したパラメーターの比較が含まれることがよくありました。 つまり、研究に 4 日間の別々の学習が含まれ、各日に 700 件のトライアルが含まれている場合、一般的な分析アプローチでは、個別の DDM モデルを各参加者およびその日のデータに適合させ、指定された日数内の 700 件のトライアルすべてを集計して、学習に関する推論を行うためのパラメータ推定値の日々の変化。 このようなアプローチは、1 日内のすべての試行は同じである、つまり、毎日の間に学習は発生せず、学習は日の間にのみ現れると暗黙的に仮定しているため、これには問題があります。 そのため、日内および日間のパラメータ変化が発生する可能性があるより正確な時間スケールと、これらの変化がどのように相互作用するかについてはほとんど知られていません。

知覚学習の評価に対する集計ベースのアプローチとそれに関連する問題は、DDM タイプのモデルを利用した研究に特有のものではありません。 代わりに、知覚学習の文献全体では、集計ベースのアプローチが一般的です (たとえば、個々のブロックまたはセッションごとにしきい値を当てはめる、適応階段からの点推定を使用する)。 より最近の研究では、集約を回避し、代わりにトレーニング時間の最小単位 (つまり試行回数) の関数として知覚能力を直接モデル化することにより、知覚学習における理論的関心の中核となる問題に、知覚の影響に関してより直接的に対処できることが示されています。知覚に関する経験13,37,38,39。 たとえば、知覚トレーニングから生じるさまざまな形式の一般化は、バイトライアルモデルを使用して分離されており、学習するための学習(つまり、学習率の向上)の形式での一般化は、知覚の即時改善とは区別されています12。

知覚学習の研究において、適切に調整された学習モデルが特に重要である主な理由の 1 つは、学習がとる機能的形式を正確に特定することで、行動レベルと機構レベルの両方で、根底にあるプロセスに関する重要な推論が可能になるためです 3,5,6 、40。 これは、学習が複数日にまたがって行われる場合に特に当てはまります。 実際のトレーニング中とセッション間の統合の両方で経験に依存した変化が発生した場合、学習軌跡の両方の特徴を変化のモデルに組み込む必要があります。 あるいは、タスク経験の全体量のみが知覚能力に影響を与える場合(たとえば、全日にわたる累積試行回数)、日間の不連続性をモデル化すると、不必要なモデルの複雑さと過学習が生じる可能性があります。

このような質問は、基礎となる DDM パラメータがさまざまな時間スケールで変化する可能性がある、証拠の蓄積プロセスである知覚的意思決定における学習に特に関連します。 実際、知覚トレーニングにおける学習のタイムスケールは明らかになることもありますが、議論の余地があることもよくあります。 特定の知覚学習実験には数百回の試行のみが含まれていましたが41、他の実験では数百回の試行が「タスク学習」として破棄され、代わりにその後の(多くの場合広範囲にわたる)変化の軌跡のみが考慮されました。 この後者の見方では、パフォーマンスの全軌跡が最初は「タスク学習」によって支配され、その後になってようやく「知覚学習」によって支配されるというもので、知覚の変化は改善のより短い時間スケール、次により長い時間スケールによって特徴づけられるはずであると予測するでしょう。 しかし、そのような予測は、知覚学習曲線の数学的特性の分析において一貫して裏付けられていません 3,24。 それにもかかわらず、他の証拠ソースは、知覚改善の基礎となるプロセスが異なる時間スケールで変化している可能性があることを示しています。 たとえば、神経画像研究では、感覚野の初期可塑性が接続性の大規模な変化に先行することが示されています 42。 おそらくさらに顕著な現象は、知覚学習を成功させるための睡眠に関連した強化の役割です43、44、45。 極端なケースでは、変化が睡眠に完全に依存している場合、その日のパフォーマンスは完全に固定され、学習曲線は日間の不連続性によって支配されることになります。 このような命題は、大量の経験的証拠と矛盾します3、24、33、39。 反対の極端な場合、完全に連続した学習の軌跡とセッション間の不連続性がまったくない場合も、公表された調査結果と同様に矛盾しているように見えます。 では、この 2 つのパターンの結果はどのように解決できるのでしょうか?

証拠蓄積モデルと RT と精度の同時分布の使用は、いずれかのデータ ソース単独よりも多くの情報を統合し、パラメーターの解釈可能性を維持する方法で統合するため、この領域に大きな機会をもたらします。 したがって、変化の単一プロセスに関する以前の証拠 3,24 は、証拠蓄積モデルのパラメーターの異なるコンポーネントで異なるダイナミクスが裏付けられており、変化の複数のタイムスケールまたはパフォーマンスの日ごとの不連続性に関する証拠と互換性がある可能性があります 43,45,46。 つまり、知覚学習中に関与するプロセスには、日間の不連続性と日間の連続性の両方が存在する可能性がありますが、これらの共存する変化の時間スケールは、パフォーマンスのプロセスレベルの分解を可能にする知覚能力の分析を利用した場合にのみ明らかになる可能性があります複数のタイムスケールで。

現在の研究では、時間の経過とともにいくつかの可能な変化形態をとる可能性があるウィナー拡散プロセスを使用して、学習者の知覚パフォーマンスをモデル化しました。 データは、参加者が点のフィールドが左方向に移動しているか右方向に移動しているかをできるだけ早く正確に回答することを要求する、以前に公開された 47 コンピューター化された行動タスクからのデータが使用されました。 4 つの別々の日に、参加者はこのタスクの 700 回の試行を完了しました (動作の一貫性の 7 つのレベルごとに 100 回の試行を行いました。「方法」を参照。公開された研究 47 では、トレーニングの最終日のみが使用されたことに注意してください)。 精度に関する聴覚フィードバックは各試行で提供されました。

上記で検討した研究と同様に、DR と RB が主な関心事でした。 4 つの変化のダイナミクス (DR、RB、またはその両方) の候補が検討されました (例については図 2 を参照)。 各パラメータの最初の可能性は、完全に静止した、または「一定」のプロセスです。この場合、パラメータは、2AFC ドット動き方向識別タスクに関する参加者の 4 日間のトレーニング全体にわたって変化しません。 2 番目の可能性 (「連続的」) には、全体の経験または試行回数の連続的な指数関数としてのパラメーターの変化が含まれます。 3 番目 (「日のリセット」) では、毎日繰り返されるその日内の連続的な変化 (その日内の試行回数の関数として) が可能で、その日のタスクの経験によるベースラインからの一時的かつ一貫した乖離を意味しますが、日の間にそのベースラインにリセットされます。 4 つ目 (「柔軟」) では、同じ速度 (指数関数の形状を定義する時定数) を持ちながら、毎日独立した開始レベルと漸近レベルを持つ 1 日以内の連続的な変化が可能になり、これにより、非常に高い柔軟性が得られます。日内と日間の両方の変化を捕捉します。 一定のパラメーターを持つモデルは他のすべてのモデル内にネストされ、日をリセットする形式の変更は柔軟な変更内にネストされ、連続的な変更は柔軟な形式の変更によってうまく模倣できます。

特定のリンクの強度は異なるリンク間で異なる可能性がありますが、特徴的な効果が観察されます(たとえば、精度 [b] は DR [c] の増加または RB [d] の増加とともに増加します。RT [a] は DR の増加または RB の減少とともに減少します)。刺激の一貫性のレベル。 ここに示されている値は、結果で報告されたモデルからの固定効果事後分布推定値と 95% CI であり、説明のみを目的として中央値刺激コヒーレンスで評価されました (補足セクション「最適なモデルの概要出力」と「表」も参照) 1~5)。

さまざまな形の変化とその組み合わせは、知覚的意思決定の基礎となるプロセスにおける特定の変化パターンを暗示しています。 知覚感度の向上により DR は経験とともに増加するはずであると予想されますが 20,32、私たちの方法ではさらに、この変化が日間の論理和 (柔軟な DR モデルで可能) によって引き起こされるのか、それとも想定されているような論理和から独立しているのかを判断することができます。継続的な DR モデルで。 さらに、RB の長期 20 と短期 33 の両方の変調が観察されていますが、これらのダイナミクスが、主にベースライン レベルから離れた日内の変化によって引き起こされる、同じ基礎となるマルチセッションの軌跡 (連続 RB) の一部であるかどうかを明示的にテストします。 (日リセット RB)、または日内と日間の両方の変更を伴う (フレキシブル RB)。

DR と RB が異なる形態の変化を取る可能性があることを考慮した場合、最終的には 5 つの可能な動的モデル (これまでの学習に関する経験的および理論的研究を考慮すると、もっともらしい) と比較のための 6 つ目の静的モデルを追加しました。 これら 5 つのモデルには、[1] 累積的な全体的な経験によって駆動され、日間の不連続性の影響を受けない両方のパラメータのダイナミクスを備えた連続 DR、連続 RB モデル、[2] 両方のパラメータの変化が両方のパラメータによって変化する柔軟な DR、柔軟な RB モデルが含まれます。日内および日間の効果、および対応する [3] 継続的 DR、フレキシブル RB モデルと [4] フレキシブル DR、継続的 RB モデル。両方のモデルの全体的な経験による変更は許容されますが、日間の不連続性または特異性のみが許容されます。単一の DDM パラメータ。 [5] 連続 DR と日リセット RB の追加の組み合わせがテストされ、連続 DR の柔軟な RB モデルのパフォーマンスが、日間の変更を行わずに RB の日内の変更のみをリセットすることに起因する可能性を排除しました。 RBの違い。

まず、上記の可能なパラメータ変更の組み合わせを使用してモデルを推定しました。 次に、どのモデルが視覚的なドット動作識別知覚学習データに最もよく適合するかを特定しました。 完全ベイジアン非線形混合効果モデルの推定と比較により、公的に入手可能な統計パッケージを使用することにより、堅牢で複製可能なモデリング フレームワークが可能になりました (「方法」を参照)。 ベイジアン モデルによって提供される追加の堅牢性は、特にパラメータ間の考えられる相関が不明な場合、推定される各パラメータに関する不確実性の固有の定量化によってもたらされます。

結果の前置きとして、DR と RB の両方で最も柔軟な変更を可能にするモデルが、実験のタイムスケール全体にわたってパラメーターが変化しないと仮定したモデルなど、他のほとんどのモデルよりもよく適合することがわかりました。 ただし、注目すべきことに、この最も柔軟なモデルを 1 つ単純化すると、適合指数がさらに向上しました。 全体的に最良のモデルには、日間の不連続性のない、比較的単純かつ制約された全体の試験数の指数関数としての DR の増加が含まれていましたが、一方、RB については、柔軟な日内および日間の変動がモデル化されました。 すべての参加者を同時にフィッティングするのではなく、各参加者に別々のモデルをフィッティングした場合に、互換性のある結果が見つかりました。 完全な混合効果非線形モデルを比較する場合でも、参加者別の個別の非線形モデルを比較する場合でも、モデル比較の複数の方法は、知覚学習は RB の柔軟な変化を伴う継続的な DR 変化の結果として最もよく理解される可能性があるという概念を裏付けました。

まずすべてのモデルの収束を評価し、次に LOOIC の変化 (leave-one-out 相互検証逸脱度 48 の近似) およびベイズ係数 (ブリッジ サンプリングを使用して推定。方法を参照) を使用してモデルを比較しました。 すべてのモデルは収束し (最大固定効果 R ハット < 1.03)、勝ったモデルの最小テール有効サンプル サイズは 311 で、発散遷移はありませんでした。 すべてのモデルの固定効果推定値については、補足説明 (セクション「最適適合モデルの概要出力」および「表 1 ~ 5」) を参照してください。 また、すべての刺激一貫性レベルで学習が明らかであるかどうかも評価しました。 参加者ごとに集計された比較では、RT がすべてのコヒーレンス レベルで確実に減少することが示されました。 一方、精度はすべてのコヒーレンスレベルで数値的に増加しましたが、統計的に信頼できるのは中間のコヒーレンスレベルについてのみでした(補足図4および5も参照)。

まず、最も複雑なモデル (柔軟な DR 柔軟な RB) と最も単純なモデル (一定の DR 一定の RB) を比較し、時間の経過とともにパラメーターを柔軟に変更できるモデルの方がよく適合することがわかりました (ΔLOOIC = −3650.5)。 その後のモデル比較では、DR と RB が経験全体の連続関数である、より倹約的な変化の形が、観察された知覚学習を効果的に説明できるかどうかをテストしました。 連続 DR、連続 RB モデルは、柔軟な DR 柔軟な RB モデル (ΔLOOIC = 1383.1) と比較してモデルの適合性を改善しませんでした。また、柔軟な DR、連続 RB モデル (ΔLOOIC = 1434.1) も改善しませんでした。 対照的に、DR が全体の試行回数の連続関数であり、RB が柔軟に変化するモデルは、より複雑な (柔軟な DR 柔軟な RB) モデルよりもモデルの適合性が向上しました (ΔLOOIC = −301.2)。 RB に対する別の制約、つまり 1 日以内の試行回数の反復連続関数 (連続 DR 日リセット RB) の制約は、連続 DR フレキシブル RB モデル (ΔLOOIC = 1931.6、プロットについては図 3 を参照) よりもよく適合しませんでした。すべての適合の相対尤度)。

LOOIC は再スケーリングされ (相対尤度として解釈されるように逆数)、0 で表される最適なモデルに正規化されました。このスケーリングは、LOOIC が類似している限り、対数ベイズ係数への近似として解釈可能性を提供します。ベイズ情報量基準 (BIC55) によって提供される予測確率に換算します。 あるいは、4 より大きく、かついくつかの標準誤差よりも大きい差 (つまり、この図のすべての差) は、あるモデルから別のモデルへのモデルの適合性が向上していることを示していると解釈できます57。 数値は、モデルの複雑さの一般的なランクを示します。 エラーバーは、モデル間の点ごとの LOOIC 予測密度の標準誤差を示します。

したがって、LOOIC 基準を使用すると、最良のモデルには継続的な DR 変更と RB の柔軟な変更が含まれます。 モデルペアごとのブリッジサンプリングを使用して推定されたベイズ係数を使用すると、非常に類似したモデル比較結果が見つかりました (表 1 を参照)。 同じモデル (継続的な全体トライアル DR と柔軟な RB) は、他の各モデルよりもよく適合します。

最も適合したモデルは、精度 (r = 0.76) と応答時間 (r = 0.56、方法と補足図 2 および 3 を参照) の両方を良好に回復しました。 このモデルは、実験全体 (つまり、トライアル 1 ~ 2800) を通じて、全体のトライアル数の指数関数として DR の改善 (増加) を示しました。 モデルの固定効果は、サンプルレベルの学習の半分までの時間が 1261 試行で、トレーニングによって DR が増加することを示しました (開始平均 = 0.44、se = 0.05、漸近線平均 = 0.96、se = 0.11)。 すべての参加者の DR は増加していると推定されました (参加者の点推定の変化、平均 = 0.516、標準偏差 = 0.175、最小 = 0.209、最大 = 0.800)。

反応境界パラメータは、日および参加者間であまり系統的に変化しませんでした(図 4 を参照)。 グループレベルでは、日ごとに多少の「リセット」を伴うわずかな減少が発生しているように見えますが、個人間および個人内のばらつきが大きいため、そのようなグループレベルの効果を解釈するのは困難です49。 ほとんどの参加者に 1 日以内の RB の減少が見られました (4 日間それぞれ、参加者の 80.9%、61.9%、76.2%、および 55.1%)。 RB の日間の変化は主に 1 日目から 2 日目にかけて減少していましたが (参加者の 95.2%)、2 日目の終わりから 3 日目の初め、または 3 日目の終わりから最初に減少した参加者は少数でした。 4 日目 (各移行の参加者の 28.6%)。

DR [a、b] と RB [c、d] の両方について、左側のパネル [a、c] は、すべての参加者に対する全体的な適合を示します (図 1 も参照)。 右側のパネル [b、d] は、3 人の参加者例の適合を示しています (変化と異質性のパターンを示すために選択されました)。 毎日は異なる線種で表されます。

混合効果構造を使用せずに、同じモデルのセットを各参加者のデータに個別に適合させ、同じ方法で参加者内の結果を比較しました。 連続 DR 柔軟な RB パラメータ化は、LOOIC 比較を使用した参加者 19/21 名およびベイズ係数比較を使用した参加者 15/21 名において最も適合したモデルでした。 また、参加者に個別に適合したモデルと、すべての参加者に同時に適合した最良のモデルを比較した場合、パラメータの参加者別の点推定値の間にはかなり高い一致が見られました (例、DR ピアソンの変化の時定数 r = 0.77、漸近的) DR r = 0.85)。 したがって、これらの比較はそれぞれ、完全な混合効果モデルの結果を補強します。 詳細については、補足説明を参照してください。

知覚学習研究へのより典型的なアプローチ(つまり、通常は参加者の精度のみを考慮するアプローチ)との比較を提供するために、ロジスティック心理測定関数の閾値の連続時間変化を使用していくつかのモデルを適合させました39,50。 これらのモデルは、結合 RT と精度の分布ではなく、精度データのみに適合しました。 試行ごとの閾値の変化の候補モデルには、一次分析で説明した連続形式、日リセット形式、および柔軟な形式に加えて、連続形式と日リセット形式の追加の組み合わせ(つまり、日リセット軌道オフセットを連続機能)。 最も適合したモデルは、中間レベルの複雑さを持つこの最後のモデル (LOOIC = 61182.7) でした。 他のモデルは、適合度の降順で、柔軟性 (LOOIC = 61202.6)、連続 (LOOIC = 61238.6)、日リセット (LOOIC = 61352.3) でした。 これらの結果は、主な結果と同様に、2 つのタイムスケールの変更を含む中程度の複雑さのモデルを裏付けています。 しかし、DDM モデルとは異なり、ロジスティック適合では、どのタイムスケールで何が変化したかに関するメカニズムの説明を提供できませんでした。 最小および最大のコヒーレンス レベルで精度が一貫して向上していないということは、これらの結果がほとんどの参加者にとって中間のコヒーレンス レベルでの精度の変化によって大きく左右されていることを意味しますが(補足図 4 を参照)、心理測定関数のこの制限は、その有用性をさらに示しています。学習中のRTと精度の同時分布を理解すること(つまり、すべてのコヒーレンスレベルでのRTの改善によるもの。補足図5を参照)。 詳細については、補足説明を参照してください。

ここでは、非線形混合効果 DDM を使用して、知覚的意思決定タスク中の 1 日内および 1 日間の変化を特徴付けました。 DR の変化は、異なる 4 日間のトレーニングにわたる試行回数の指数関数としてモデル化するのが最適であることがわかりました。 対照的に、RB の変化は、変化の軌跡における 1 日内の連続的な変化と非系統的な日間の変動の両方を伴う不均一なダイナミクスによって最もよくモデル化されました。 このような発見は、DR をサル 32 とヒト 31,34 の知覚学習の指標として特定した初期の研究の結論を裏付けると同時に、変化の時間スケール間の判断におけるさらなる特異性を加えています。

より広範には、この研究は、知覚的意思決定において観察される RB の急速な調整を裏付けるものであり 33、同時に、知覚学習における 2 つの一見矛盾する観察、つまり経験の連続関数としての改善 39 と日間の大きな不連続性 43 について統一的な説明の可能性を提供するものである。 今回の研究は、これらの現象のそれぞれが独自の時間スケールで発生している可能性があることを示唆しています。 重要なのは、意思決定を仲介するさまざまなプロセス (特に DR と RB) がかなり異なるダイナミクスで変化していることを示していることです。 これまでの研究では、トレーニングセッション間(特に睡眠中)の抑制性神経活動が、遡及的干渉に対する改善者の耐性を高めるために重要な役割を果たしていることが特定されており、我々の結果は複数のプロセスについて補完的な証拠を提供している。 知覚感度の改善はトレーニングによって徐々に蓄積されるが(例えば、より高いDRや興奮性神経状態や可塑性神経状態と関連する)、多くの観察される行動の変化は、実際には抑制プロセスの調節の結果である可能性がある(例えば、より高い決定基準RBと関連する)。抑制性と安定した神経状態を伴う)。 つまり、抑制プロセスが上方制御または下方制御される速度は、知覚プロセスが修正可能な速度よりもはるかに速い可能性があり、これにより、多くの行動の変化だけでなく、統合および干渉に対する重要なプロセスも引き起こされます。

そのため、貧弱な離散選択行動データのみを使用すると、学習軌道に関する可能な推論が妨げられたり、偏ったりする可能性があります 31。 たとえば、パフォーマンスの大幅な向上は一部のコヒーレンス レベルの精度でのみ発生しましたが、RT ではより広範な向上が見られました。 これらの両方を単一のモデルベースのアプローチに統合することで、変動の原因をより適切に特定し、知覚感度と意思決定プロセスの変化を特定できるようになりました。 実際、今回の研究は、各トレーニング試行の関数としての知覚学習の指標として拡散モデルの DR パラメータを使用することの明確な正当化を提供します。 RB の解釈可能性は、日内と日間の両方のダイナミクスが存在するため、より複雑になります。 このような変化は、多かれ少なかれリスクを回避するなど、意思決定中の適応的な選択を反映するRBと一致していますが、このような一日全体および参加者全体にわたる大きな不均一性の原因は依然としてよくわかっていません。 収束的な測定(例:神経画像)またはパフォーマンスの形式化された予測(例:「最適な」警戒レベル33)は、このより速くよりばらばらなタイムスケールで起こる変化のプロセスを将来的に明確にする可能性があります。

現在の研究の重要な要素は、高度でありながら比較的アクセスしやすい定量的手法を使用していることです (最適なモデルのコードについては補足を参照してください)。 統計パッケージで DDM 推定手法がますます広く利用できるようになったことで、ここで報告する分析を実行するために必要なツールをより多くの研究者に提供できるようになりました。 必要な計算リソースは膨大でしたが (モデルごとに少なくとも数週間のコンピューター時間)、ますます高性能のコンピューターが普及するにつれて、その制限はそれほど問題ではなくなるはずです。 さらに、学習に適切なモデルのパラメーター化に関する基礎が確立されたら、それらのモデルをテスト ケースとして使用して、より効率的なフィッティング方法を開発および評価できます。 ここで報告されたモデルは、知覚学習における変化の考えられるモデルのほんの一部を表しているにすぎないことを私たちは認識しています。 それでも、新規で有益な推論にはそれらが十分であると考えており、情報提供性が欠如している可能性が高く、モデルパラメータの推定に必要な膨大な計算リソースが必要なため、さまざまな中間モデルを適合させていません。

DDM が認知プロセスだけでなく知覚プロセスにも幅広く適用できるのと同様に、ここで適用されるアプローチは、視覚的な運動認識における学習をはるかに超えた用途を持っています。 DDM を使用して学習の軌跡に寄与するメカニズムをより深く理解することは、単語学習 52、認知トレーニング、または情報を迅速かつ正確に処理する必要があるその他の学習コンテキストで役立つ可能性があります。

知覚学習は、成人の神経可塑性のメカニズムへの窓口として機能するだけでなく、多くの翻訳的可能性を秘めていますが、知覚学習を理解するには、学習者の知覚的意思決定からの適切な推論が前提となります。 知覚的意思決定の正式な証拠蓄積モデルを使用することで、学習の軌跡に関する一見矛盾した命題を説明できます。証拠蓄積のさまざまな要素は、トレーニング セッション内および独立したタイムスケールでの日ごとに変化する可能性があります。 ここで我々は、知覚感度 (DR) が試行回数の連続関数として変化する一方、決定を引き出すために必要な証拠の量 (RB) はトレーニング セッション内で連続的に、および日ごとに非系統的に動的に変化するという証拠を提示しました。

データはアーカイブされてお​​り、この論文では二次データ分析のみが行われました。 この手順は当初、ロチェスター大学の倫理委員会によって承認されており、各参加者からインフォームドコンセントが得られました。 Green、Pouget、および Bavelier で最初に報告されたデータ 47 は、連続 4 日間のドットモーション弁別タスクを完了した 21 人の男性若年成人参加者から収集されました 53,54。 元の論文では前日のデータのみが報告されていました。 参加者は当初、「アクション ビデオ ゲーム プレイヤー」グループ (平均年齢 = 18.8) または「アクション ビデオ ゲーム プレイヤーではない」グループ (平均年齢 = 20.6) のいずれかに分類されました。 1 人の参加者は、1 つのセッションで説明のつかない非常に長い応答時間の分布があったため、元のサンプル 22 人から除外されました。 現在の論文は、ゲームプレイヤーグループ間の潜在的な差異には主に関係しておらず、これについては取り上げませんが、すべてのモデルには、各拡散モデルパラメーターのグループ間の潜在的な差異を制御する被験者間の固定効果が含まれています (以下を参照)。 このような固定効果パラメーターは、参加者レベルのパラメーターで起こり得る二峰性を軽減するはずです。 刺激は、Psychtoolbox (Brainard 1997) を使用して 75 Hz CRT モニター上に提示されました。 左または右の一貫性パーセンテージは、ランダムな順序で 0.8%、1.6%、3.2%、6.4%、12.8%、25.6%、または 51.2% でした。

トライアル連続時間ドリフト拡散モデルを適合させるために、R の brms パッケージを使用しました。このパッケージ自体はスタン ベイジアン モデリング フレームワークを使用しています 17,18,19。 モデルは本質的に、結合 RT と精度分布の非線形一般化回帰であり、各試行のドリフト拡散パラメーターはすべての試行にわたって静的であるか、試行番号の関数 (いくつかの異なる方法でパラメーター化されています。次のセクションを参照) のいずれかです。 次に、各モデルの DDM パラメーターは、変化しないか、時間関連変化の特定のコンポーネントに関連するかにかかわらず、それ自体が一般化線形混合効果モデルの適合値でした (並行して推定されます。参考文献 38 を参照)。 このようなフレームワークにより、すべての参加者のすべてのパラメータを同時に推定することが可能になりました。 私たちのアプローチのもう 1 つの重要な利点は、brms にはウィーナー拡散一般化線形モデルのデフォルトの事前分布が含まれているため、手動で指定する必要がある事前分布はモデルの非線形成分 (つまり、変更にかかる時間や NDT など) に関連する事前分布のみであることです。 0.001 秒の小さな追加オフセットを使用します)。 デフォルトの事前分布は、新しいデータセットへの実装の直接の適用性を向上させ、他の人がそのような分析を行うのを容易にしますが、その一方で、効率が低下する可能性が高く、ベイズ因子の結果を解釈するのがより困難になるという代償を伴います(つまり、事前分布が適切ではないため)。データセットまたは仮説に明示的に適応されています)。 詳細については、補足説明を参照してください。

実装されたパラメーター変更の正確な組み合わせに関係なく、変更は常に試行回数の指数関数である DDM パラメーターとして定義されました (式 1 を参照)。 すべての参加者は、上記の混合効果構造 (つまり、参加者ごとのランダム切片) を利用して、モデルの DDM パラメータのセットを推定させました。 このパラメータ化では、変化の時定数 (速度または逆速度) は、特定のパラメータの開始点と漸近線の両方から独立していました。 比較されるモデル間の重要な違いには、変化のタイムスケール (つまり、trialNumber が 1 日内の試行数であるか、全日にわたる累積であるか)、および 1 日内の試行数が考慮される場合には、開始パラメータと漸近線パラメータが全日にわたって共有されるかどうかが含まれます。あるいは日によって変化することが許されるかどうか。 レート パラメーターは、変化の 50% までの時間定数のバイナリ ログでした。 レートに定数 2 を追加すると、2 回未満の試行で軌跡が変化の 50% を示すことがなくなり、モデルの識別と推定が容易になります。 param は DR または RB であることに注意してください。

比較されるモデルは、パラメーターが時間によって変化しない「一定」モデルから始まりました。 この比較では、コヒーレンスは線形 (未変換) または対数変換され、中央値中心になりました。 これら 2 つのモデル間の比較により、DR とコヒーレンスの間の線形関係の経験的根拠が確立されました53。 DR に関連した刺激強度のスケーリングを決定するためのこの比較では、対数変換された刺激コヒーレンス DR をもつ定数パラメーター モデルが、コヒーレンスの線形関数 (ΔLOOIC = 3781.3)。 このため、その後のすべての分析ではコヒーレンスの線形関数が使用されました。

次に、全体の試行回数の連続関数 (連続)、または参加者内での 1 日にわたる一定の開始と漸近線を伴う 1 日以内の試行回数の連続関数 (日リセット) としてパラメーターを変化させることができました。 最も複雑なモデル (柔軟) では、毎日別々の開始点と漸近線を使用して、1 日内の変化を許容しました。 推定を支援するために、各参加者は 1 つのレートのみを持っていました。

これらの形態の変化により、モデルの比較により、経験に依存した変化の異なる潜在的なメカニズムを判断することが可能になりました。 タスクの累積経験のみによる変化のメカニズム、つまり効果の法則は、より倹約性が高い(つまりパラメータ数が少ない)ため、柔軟な形の変化よりも連続形の変化に利益をもたらします。 同様に、各参加者のベースラインからの日内の変動とそのベースラインへの日中の復帰を伴う変化のメカニズムは、日をリセットする変化のパラメータ化によって示されます。これも、完全に柔軟な形式の変化よりも節約的です。 対照的に、モデル比較がパラメーターの柔軟な軌道をサポートしている場合、それは、そのパラメーターの変化メカニズムが不均一である可能性が高いことを示します。 考えられる多くの生成モデルは、この柔軟な変更形式と互換性があり、(連続モデルや日リセット モデルのように) 制約を選択的に適用することで、柔軟なモデルの複雑さが正当であるかどうか、またはより節約的で機械的に解釈可能なモデルが適切であるかどうかをテストできます。正当化された。

式で説明したように、 図 1 では、パラメーターは、開始値、漸近値、および変化率を定義する 50% の変化時定数を備えた 3 パラメーターの時間の指数関数として定義されました 3,24,37。 連続変化と日リセット変化は、参加者ごとに 1 回の開始、レート、漸近線を推定します。 2 つの変化の形態は、その変化の時間スケールが異なるだけです。 柔軟な変更では、4 日間にわたる参加者ごとに 1 つのレートと、各参加者ごとに毎日 1 つの開始点と 1 つの漸近線を推定しました。 可能であればすべての事前確率はデフォルトであり、レートパラメータは最大試行数の 25% を中心とした通常の事前確率 (つまり、当日内の変更の場合は 175、実験全体の変更の場合は 700) を持ちました。 これらの事前分布の SD は 1 であったため、密度の大部分 (つまり、+2 と -2 SD の間) は、変化の完全なタイムスケールとその変化のタイムスケールの 1/16 の間に収まりました。

明確さと R 実装との類似性を目的として、一般的な「Wilkensen」形式でモデル式をレポートします (例:driftRate ~dictorA + (predictorB | groupingVariable))。 この構文では、予測変数 (ここではドリフト拡散パラメーター) はチルダの左側にあります。 予測子はチルダの右側にあります。 1 は推定された切片値を示します。 括弧内の予測子の成分は変量効果であり、予測子は縦棒の左側にあり、グループ化変数は縦棒の右側にあります。

すべてのモデルには次の共通機能がありました。

アクション ビデオ ゲーム プレーヤー (AVGP) と非アクション ビデオ ゲーム プレーヤー (NVGP) の両方が含まれており、特定のモデルの各パラメーターのグループ間の差異を制御する固定主効果が含まれています。 (すべてのパラメータには参加者レベルの推定係数も含まれます)。 RTが0.16未満または2.5を超える試験は除外された。 時間発展成分は、変化の 50% までの時定数のバイナリ対数 (つまり、2 を底とする) として推定されました。

ドリフト率はリンク機能なしで推定されました。 事前確率は、ドリフト レート (データが与えられた場合) のデフォルトの brms 事前確率、student_t(3,1,10) に設定されました。 モデル全体で、ドリフト レートは常に固定効果切片、被験者別切片、および中央値中心コヒーレンスの被験者別傾きを使用して推定されました (つまり、ドリフト レートは刺激コヒーレンスの関数として被験者ごとに線形に変化します)。 。 コヒーレンスとドリフト レートの関係が線形であるという仮定をテストするために、「生の」コヒーレンス パーセンテージまたはその対数変換を含むモデルがテストされました。 式の例: 固定ドリフト レート:drift_rate ~ 1 + VGPstatus + (coherence || subj)、時間発展ドリフト レートの漸近線: drAsym ~ 1 + VGPstatus + (coherence || subj)。

応答境界は対数スケールで推定されました。 すべてのモデルの事前確率は、応答境界 (データが与えられた場合) のデフォルトの brms 事前確率、normal(-0.6, 1.3) に設定されました。 被験者別の切片と固定効果の切片が推定されました。 式の例: 固定応答境界: response_boundary ~ 1 + VGPstatus + (1 || subj)、時間発展応答境界の漸近線: rbAsym ~ 1 + VGPstatus + (1 || subj)。

非決定時間は、オフセット 0.001、平均 0.15 の指数分布を使用して推定されました。 このオフセット手法により、サンプリングが妥当な値に制限され、モデルの効率が向上しました。 すべてのモデルがこのアプローチを使用する限り、どのモデルや比較にもバイアスが導入されるべきではありません。 固定効果切片および被験者別切片が推定されました。 式の例: ndt ~ 0.001 + ndtOffset; ndtOffset ~ 1 + (1 || subj)。 バイアス項は、固定効果切片と被験者別切片 (つまり、バイアス ~ 1 + VGPstatus + (1 || subj)) を使用して推定されました。 バイアスはロジット スケールで推定され、事前分布は正常 (0,1) でした。

上記の変化形態を考慮して、時間変化する DR パラメーターと RB パラメーターの組み合わせをテストしました (「はじめに」を参照)。 時間とともに変化する非決定時間のテストも検討しましたが、非決定時間パラメータの経験的変化が、データ間の回復可能性の欠如により偽のパターンを反映する可能性が高いため、現在の原稿にはこれらのモデルを含めないことにしました。非判定時間とRB14。 プライマリ モデルの比較では、leave-one-out 相互検証 48 への効率的な近似を使用しました (loo R パッケージのドキュメントも参照)。 この方法を使用して、LOO 情報基準 (LOOIC) を報告します。LOO 情報基準 (LOOIC) は逸脱度スケール (つまり、値が低いほど優れています) であり、AIC または BIC 値と同様に解釈できます (例: 55、56 を参照)。 さらに、4 より大きいモデルの LOOIC 差分値は、差分の標準誤差の数の観点から解釈可能です57。

追加のモデル比較には、ブリッジ サンプリングを使用して推定されたベイズ係数が使用されました58。 15 回のブリッジ サンプリング実行は、標準の多変量正規提案分布よりも堅牢な、歪んだ多変量正規提案分布を使用して完了しました。 ベイズ因子は、従来のモデル選択のしきい値 (つまり、一方のモデルが他方のモデルよりも 3 倍多くの証拠が「実質的な証拠」であること) が -1 および +1 のカットオフと一致するように、底 3 の対数で変換されました。 15 回のブリッジ サンプリング実行のうち、最も曖昧なもの (つまり、0 に最も近い BFlog3) を報告します。

絶対モデル適合(つまり、生データの回復)は、データを 25 試行ブロック(参加者あたり合計 112 ブロック)に分割し、コヒーレンス レベルごとに各ブロック内の RT と精度を平均することによって評価されました。 最適モデルからのデータと予測値の両方がこの手順に従いました。 これらのビン化された平均を考慮すると、データとモデル予測の間のゼロ次積率相関は、生データのパターンのモデル回復を示すのに役立ちました。 さらなる視覚化は補足図で見ることができます。 2と3。

追加の比較では、メインの結果で比較された 6 つのモデルのそれぞれを参加者に個別に適合させ、参加者内のベイズ係数と LOOIC を使用しました。 参加者別の適合では、混合効果モデルがすべての参加者に同時に適合するのと同じモデルのセット (単一の参加者に関連する式と事前分布) が使用されました。 同様に、比較には LOOIC 比較とブリッジ サンプリングを使用したベイズ係数が使用されました。 すべての指数は収束を示しました。

知覚的意思決定データをフィッティングする(つまり、精度のみを考慮する)従来の方法との比較は、ロジスティック心理測定関数を使用して実装されました50。 ロジスティック モデルでは、精神物理学の古典的な分析により密接に準拠したアプローチ、つまり、動きが特定の方向にあると参加者が応答する確率に一貫性を結び付けるロジスティック心理測定関数を当てはめました。 1% の失効率が使用されました。 主な結果と同様に、パフォーマンス (ここではしきい値) は時間の連続指数関数としてモデル化され、「時間」はセッション内の試行回数、全体の試行回数、またはその 2 つの組み合わせに対応します。 応答時間は Z スコア付けされ、DDM モデルにも含まれていたすべての情報をロジスティック モデルに含める大まかな方法​​として、開始閾値パラメーターと漸近閾値パラメーターのそれぞれについて、参加者ごとの応答時間のランダムな傾きが推定されました。

研究デザインの詳細については、この記事にリンクされている Nature Research レポートの概要をご覧ください。

すべてのデータは https://doi.org/10.5281/zenodo.7025263 で入手できます。

モデル コードは、対応する著者へのリクエストに応じて入手できます。

Deveau, J.、Lovcik, G.、Seitz, A. 知覚学習の治療効果。 カー。 トレンドニューロール。 7、39–49 (2013)。

PubMed PubMed Central Google Scholar

Mayer, RE 教育心理学は何の役に立つのですか? 認知と指示の場合。 教育する。 サイコル。 36、83–88 (2001)。

記事 Google Scholar

ドーシャー、BA & ルー、Z.-L. 知覚学習におけるパフォーマンス向上の関数形式: 学習率と転移。 サイコル。 科学。 18、531–539 (2007)。

論文 PubMed Google Scholar

Gold, JI & Ding, L. 知覚的意思決定のメカニズムが心理測定機能にどのように影響するか。 プログレ。 ニューロビオール。 103、98–114 (2013)。

論文 PubMed Google Scholar

ヒースコート、A.、ブラウン、S.、ミューホート、DJ べき乗則の廃止: 指数関数的な実践法則の事例。 サイコン。 ブル。 改訂 7、185–207 (2000)。

論文 CAS PubMed Google Scholar

Newell, A. & Rosenbloom, PS スキル習得のメカニズムと実践の法則。 認知スキルとその獲得 (JR アンダーソン編) 1–51 (Lawrence Erlbaum、1981)。

Heathcote, A. & Hayes, B. 拡散対線形弾道蓄積: 心理的メカニズムについての異なる結論による応答時間の異なるモデル? できる。 J.Exp. 心理学/牧師カナディアン・デ。 心理学実験 66、125–136 (2012)。

Google スカラー

Pedersen, ML、Frank, MJ & Biele, G. 強化学習における選択ルールとしてのドリフト拡散モデル。 サイコン。 ブル。 改訂 24、1234–1251 (2017)。

論文 PubMed PubMed Central Google Scholar

Ratcliff, R. 記憶回復の理論。 サイコル。 改訂 85、59–108 (1978)。

記事 Google Scholar

Ratcliff, R. & Tuerlinckx, F. 拡散モデルのパラメーターの推定: 汚染物質の反応時間とパラメーターの変動性への対処法。 サイコン。 ブル。 改訂 9、438–481 (2002)。

論文 PubMed PubMed Central Google Scholar

Gallistel、CR 学習の組織。 (MITプレス、1993年)。

Kattner, F.、Cochrane, A.、Cox, CR、Gorman、TE & Green、CS 学習率の変化としての逐次知覚トレーニングからの知覚学習の一般化。 カー。 バイオル。 27、840–846 (2017)。

論文 CAS PubMed Google Scholar

Zhang、P.、Zhao、Y.、Dosher、BA、Lu、Z.-L。 知覚学習における知覚感度の変化の詳細な時間経過を評価します。 J.Vis. 19、9 (2019)。

論文 PubMed PubMed Central Google Scholar

Dutilh、G. et al. 応答時間データ推論の品質: 認知モデルの有効性を盲検で共同評価します。 サイコン。 ブル。 改訂 26、1051–1069 (2019)。

論文 PubMed Google Scholar

フランク、MJ 他人間の強化学習中の動的決定パラメータの fMRI および EEG 予測子。 J. Neurosci. 35、485–494 (2015)。

論文 CAS PubMed PubMed Central Google Scholar

Vandekerckhove, J.、Tuerlinckx, F. & Lee, MD 2 つの応答時間を選択するための階層型拡散モデル。 心理学的方法 16、44–62 (2011)。

論文 PubMed Google Scholar

ビュルクナー、P.-C. brms: Stan を使用したベイズ多レベル モデル用の R パッケージ。 J.Stat. 柔らかい。 80、1–28 (2017)。

記事 Google Scholar

スタン開発チーム。 Stan モデリング言語のユーザー ガイドおよびリファレンス マニュアル。 (2022年)。

スタン開発チーム。 Rstan: Stan への R インターフェイス。 (2022年)。

Zhang, J. & Rowe, JB 視覚知覚学習中の速度と精度のトレードオフの解離可能なメカニズムが、階層ドリフト拡散モデルによって明らかにされます。 フロント。 神経科学。 8、69 (2014)。

論文 PubMed PubMed Central Google Scholar

Shadlen, MN & Kiani, R. 認知の窓口としての意思決定。 ニューロン 80、791 ~ 806。

論文 CAS PubMed Google Scholar

Mulder, MJ、Wagenmakers, E.-J.、Ratcliff, R.、Boekel, W. & Forstmann, BU 脳内のバイアス: 事前確率と潜在的利得の拡散モデル分析。 J. Neurosci. 32、2335–2343 (2012)。

論文 CAS PubMed PubMed Central Google Scholar

Petrov, AA、Van Horn, NM & Ratcliff, R. 拡散モデル分析によって明らかにされた解離可能な知覚学習メカニズム。 サイコン。 ブル。 改訂版 18、490–497 (2011)。

論文 PubMed Google Scholar

Cochrane, A. & Green, CS トライアルごとおよび参加者ごとのモデルを使用した学習の基礎となる機能の評価: 2 つの視覚的知覚学習パラダイムからの証拠。 J.Vis. 21、5 (2021)。

論文 PubMed PubMed Central Google Scholar

Fahle, M. 知覚学習: 特異性と一般化。 カー。 意見。 ニューロビオール。 15、154–160 (2005)。

論文 CAS PubMed Google Scholar

Ahissar, M.、Nahum, M.、Nelken, I. & Hochstein, S. 逆階層と感覚学習。 フィロス。 トランス。 R. Soc. B: バイオル。 科学。 364、285–299 (2009)。

記事 Google Scholar

アイオワ・ジョンストンら。 放射線画像における虫垂炎診断の知覚学習。 J.Vis. 20、16 (2020)。

論文 PubMed PubMed Central Google Scholar

Kellman, PJ & Garrigan, P. 知覚学習と人間の専門知識。 物理学。 Life Rev. 6、53–84 (2009)。

論文 PubMed Google Scholar

Lu, Z.-L.、Lin, Z. & Dosher, BA 実験室からの知覚学習をアプリケーションに変換します。 トレンド認知度科学。 20、561–563 (2016)。

論文 PubMed PubMed Central Google Scholar

Polat, U.、Ma-Naim, T.、Belkin, M.、Sagi, D. 知覚学習による成人弱視の視力の改善。 手順国立アカデミー。 科学。 USA 101、6692–6697 (2004)。

論文 CAS PubMed PubMed Central Google Scholar

Liu、CC、Watanabe, T. 知覚学習における速度と精度のトレードオフの説明。 ヴィス。 解像度 61、107–114 (2012)。

論文 PubMed Google Scholar

Eckhoff, P.、Holmes, P.、Law, C.、Connolly, PM、Gold, JI 学習中の意思決定のモデルとして可変ドリフト レートを使用する拡散プロセスについて。 ニュージャージー州物理学。 10、nihpa49499 (2008)。

記事 CAS Google Scholar

ニュージャージー州エバンスとサウスダコタ州ブラウン 人々は実践と指導を経て、単純な意思決定において最適な政策を採用します。 サイコン。 ブル。 改訂第 24 巻、597–606 (2017)。

論文 PubMed Google Scholar

Jia, K. et al. 視覚的知覚学習は、人間の脳の意思決定ネットワークを調整します。これは、心理物理学、モデリング、および機能的磁気共鳴画像法からの証拠です。 J.Vis. 18、9 (2018)。

論文 PubMed Google Scholar

Schmiedek, L. & Lindenberger 百日間の認知トレーニングが成人期の広範な認知能力を向上させる: COGITO 研究の結果。 フロント。 神経科学の老化。 https://doi.org/10.3389/fnagi.2010.00027 (2010)。

論文 PubMed PubMed Central Google Scholar

Kühn, S. et al. 脳の領域は、トレーニング前後の若年者と高齢者における知覚的意思決定の個人差と一貫して関連しています。 J.Cogn. 神経科学。 23、2147–2158 (2011)。

論文 PubMed Google Scholar

Cochrane, A. TEfits: 時間発展インデックスの非線形回帰。 J. オープンソース ソフトウェア。 5、2535 (2020)。

記事 Google Scholar

Cochrane, A. & Green, CS パフォーマンス変化の軌跡は、作業記憶と流動性知能の間に複数の解離可能なリンクがあることを示しています。 npj 科学。 学ぶ。 6、33 (2021)。

論文 PubMed PubMed Central Google Scholar

Kattner, F.、Cochrane, A. & Green, CS 2-AFC 識別タスクにおける知覚学習を説明する試験依存の心理測定関数。 J.Vis. 17、3 (2017)。

論文 PubMed Google Scholar

Newell、KM、Mayer-Kress、G.、Hong、SL、Liu、Y.-T。 適応と学習: パフォーマンスのダイナミクスの特徴的な時間スケール。 ハム。 移動。 科学。 28、655–687 (2009)。

論文 PubMed Google Scholar

Poggio, T.、Fahle, M. & Edelman, S. 視覚過敏における迅速な知覚学習。 サイエンス 256、1018–1021 (1992)。

論文 CAS PubMed Google Scholar

カン、D.-W. 他。 構造的および機能的接続性は、視覚知覚学習の後期段階で視覚野を超えて変化します。 科学。 議員第8号、5186号(2018年)。

論文 PubMed PubMed Central Google Scholar

Karni, A. & Sagi, D. 視覚スキルを習得する時間の流れ。 ネイチャー 365、250–252 (1993)。

論文 CAS PubMed Google Scholar

サウスカロライナ州メドニック、DJ カイ、J カナディ、SPA ドラモンド 言語記憶、運動記憶、知覚記憶に対するカフェイン、昼寝、プラセボの利点を比較。 振る舞い。 脳解像度 193、79–86 (2008)。

論文 CAS PubMed PubMed Central Google Scholar

玉木 正 他睡眠が始まるまで、報酬は視覚的知覚学習を促進しません。 手順国立アカデミー。 科学。 USA 117、959–968 (2020)。

論文 CAS PubMed Google Scholar

Yotsumoto, Y.、Watanabe, T.、Sasaki, Y. 知覚学習の時間経過におけるパフォーマンスと脳の活性化の異なるダイナミクス。 ニューロン 57、827–833 (2008)。

論文 CAS PubMed PubMed Central Google Scholar

Green, CS、Pouget, A. & Bavelier, D. アクション ビデオ ゲームの一般的な学習メカニズムとしての確率的推論を改善しました。 カー。 バイオル。 20、1573–1579 (2010)。

論文 CAS PubMed PubMed Central Google Scholar

Vehtari, A.、Gelman, A. & Gabry, J. リーブワンアウト相互検証と WAIC を使用した実践的なベイジアン モデルの評価。 統計 Comput 27、1413–1432 (2017)。

記事 Google Scholar

Brown, S. & Heathcote, A. 参加者全体および参加者内の学習曲線を平均化します。 振る舞い。 解像度メソッドのインストゥルム。 Comput 35、11–21 (2003)。

論文 PubMed Google Scholar

Dale, G.、Cochrane, A. & Green, CS 知覚学習における学習と一般化の個人差予測因子。 10時。 知覚する。 精神物理学。 https://doi.org/10.3758/s13414-021-02268-3 (2021)。

論文 PubMed Google Scholar

玉木 正 他ノンレム睡眠とレム睡眠は視覚学習に相補的に貢献します。 ナット。 神経科学。 23、1150–1156 (2020)。

論文 CAS PubMed PubMed Central Google Scholar

Dutilh, G.、Vandekerckhove, J.、Tüerlinkx, F. & Wagenmakers, E.-J. 練習効果の拡散モデル分解。 サイコン。 ブル。 改訂 16、1026–1036 (2009)。

論文 PubMed Google Scholar

Palmer, J.、Huk, AC & Shadlen, MN 知覚的決定の速度と精度に対する刺激の強さの影響。 J.Vis. 5、376–404 (2005)。

論文 PubMed Google Scholar

ワタマニウク、SNJ & Sekuler、R. 動的ランダムドット刺激における時間的および空間的統合。 ヴィス。 解像度 32、2341–2347 (1992)。

論文 CAS PubMed Google Scholar

ワーゲンメーカー、E.-J. p 値に関する広範な問題に対する実用的な解決策。 サイコン。 ブル。 改訂版 14、779–804 (2007)。

論文 PubMed Google Scholar

ワーゲンメーカー、E.-J. & Farrell、S. 赤池重みを使用した AIC モデルの選択。 サイコン。 ブル。 改訂 11、192–196 (2004)。

論文 PubMed Google Scholar

Sivula, T.、Magnusson, M.、Matamoros, AA、Vehtari, A. ベイジアン リーブワンアウト相互検証ベースのモデル比較における不確実性。 プレプリントは http://arxiv.org/abs/2008.10296 (2022) にあります。

グローナウ、QF、シングマン、H. & ワーゲンメーカー、E.-J. Bridgesampling: 正規化定数を推定するための R パッケージ。 J.Stat. 柔らかい。 92、1–29 (2020)。

記事 Google Scholar

リファレンスをダウンロードする

この研究は、一部は DB に対する海軍研究局 N00014-20-1-2074 によって支援され、一部は CSG に対する海軍研究局補助金 N00014-17-1-2049 によって支援されました。資金源は研究設計、データ収集に直接関与していませんでした。 、分析、原稿の準備、またはこの研究へのその他の直接的な関与。

ジュネーブ大学、ジュネーブ、スイス

アーロン・コクラン & ダフネ・バベリエ

キャンパスバイオテック、ジュネーブ、スイス

アーロン・コクラン & ダフネ・バベリエ

ブラウン大学、プロビデンス、ロードアイランド州、米国

アーロン・コクラン

レンセラー工科大学、トロイ、ニューヨーク州、米国

クリス・R・シムズ

ハミルトン大学、クリントン、ニューヨーク州、米国

ヴィクランス・R・ベジャンキ

ウィスコンシン大学 - 米国、ウィスコンシン州マディソン、マディソン

C.ショーン・グリーン

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

AC はデータ分析と原稿作成を実施しました。 CSG と DB はデータ分析と原稿作成についてアドバイスしました。 CS と VRB は予備的なデータ分析を実施し、準備された原稿についてコメントしました。 著者全員が最終原稿を承認しました。

アーロン・コクランへの通信。

著者らは、競合する金銭的利益はないと宣言しますが、以下の競合する非金融的利益があると宣言します。 DB は、ボストンにある Akili Interactive の創設メンバーです。

発行者注記 Springer Nature は、発行された地図および所属機関の管轄権の主張に関して中立を保っています。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

コクラン、A.、シムズ、CR、ベジャンキ、VR 他学習の複数のタイムスケールは、知覚的意思決定中の証拠蓄積プロセスの変化によって示されます。 npj 科学。 学ぶ。 8、19 (2023)。 https://doi.org/10.1038/s41539-023-00168-9

引用をダウンロード

受信日: 2022 年 9 月 12 日

受理日: 2023 年 5 月 15 日

公開日: 2023 年 6 月 8 日

DOI: https://doi.org/10.1038/s41539-023-00168-9

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供