คลังเก็บป้ายกำกับ: DeepMind

หัวหน้าทีม Machine Learning แอปเปิลที่ลาออกเพราะต้องกลับเข้าออฟฟิศ ย้ายไป DeepMind

Bloomberg รายงานข่าวว่า Ian Goodfellow ผู้อำนวยการฝ่าย Machine Learning ของแอปเปิลที่เพิ่งลาออก ซึ่งคาดว่าเป็นเพราะนโยบายของแอปเปิลให้กลับเข้าทำงานที่ออฟฟิศ ล่าสุดย้ายไปอยู่กับ DeepMind บริษัทลูกของ Alphabet แทนแล้ว

ตัวของ Goodfellow เองเคยเป็นนักวิจัยกับกูเกิลมาก่อนแล้วสองรอบ รอบแรกอยู่กับทีม Google Brain ก่อนย้ายไป OpenAI แล้วกลับมากับ Google Research จนถึงปี 2019 จึงย้ายไปอยู่กับแอปเปิล การกลับมารอบนี้ (ถึงแม้ไปอยู่กับ DeepMind ไม่ได้อยู่กับกูเกิลตรงๆ) ก็เป็นเหมือนการกลับบ้านเก่าของเขานั่นเอง

วันนี้แอปเปิลเพิ่งประกาศเลื่อนแผนการกลับออฟฟิศออกไป โดยอ้างว่าเป็นเพราะจำนวนผู้ป่วย COVID-19 กลับมาเพิ่มจำนวนขึ้น

No Description

ที่มา – Bloomberg

from:https://www.blognone.com/node/128547

DeepMind สร้างปัญญาประดิษฐ์ช่วยนักโบราณคดีเติมข้อความในบันทึกภาษากรีก พร้อมทำนายต้นกำเนิดและอายุ

DeedMind สร้างปัญญาประดิษฐ์ Ithaca สำหรับอ่านบันทึกภาษากรีกจากศิลาจารึกที่มักมีส่วนที่ขาดหายไป แล้วเติมข้อความที่ขาดหาย, ทำนายแหล่งกำเนิดของบันทึก, และทำนายช่วงเวลาบันทึก

การสร้างปัญญาประดิษฐ์อาศัยชุดข้อมูล Packard Humanities Institute (PHI) ที่บันทึกข้อความจากจารึกต่างๆ ถึง 178,551 ชุด โดยมีหมายเลขประจำข้อความ, ช่วงเวลา, และสถานที่ที่บันทึก โดยมีข้อความที่ใช้ฝึกปัญญาประดิษฐ์ได้ 78,608 ชุด

Ithaca แบ่งออกเป็นสองชั้น คือส่วนลำตัว (torso) สำหรับอ่านข้อความ โดยภายในเป็นสถาปัตยกรรมแบบ transformer ที่มักใช้ในการประมวลผลภาษา ในชั้นที่สองจะมีหัวสามหัวเป็นโมเดลปัญญาประดิษฐ์สำหรับทำนายค่าต่างๆ ทั้งข้อความที่หายไป, พื้นที่ที่บันทึกข้อความ, และช่วงเวลาที่บันทึก

ตัว Ithaca ถูกออกแบบให้ช่วยเหลือนักโบราณคดี การทำนายจึงแจกแจงความมั่นใจของค่าต่างๆ ที่เป็นไปได้ หากดูการทำนายข้อความหายจาก Ithaca จะให้ความแม่นยำ 62% แต่หากทำงานร่วมกับนักโบราณคดีจะได้ความแม่นยำถึง 72% ขณะที่ การทำนายแหล่งที่มาแม่นยำ 71% และการทำนายช่วงเวลาได้ช่วงเวลาใกล้เคียงข้อมูลห่างกันน้อยกว่า 30 ปี

ทาง DeepMind หวังว่าจะมีการทำ Ithaca ไปใช้กับงานวิจัยหรือพิพิธภัณฑ์ต่อไปในอนาคต โดยตอนนี้เปิดปัญญาประดิษฐ์ให้ใช้งานฟรี และมีเวอร์ชั่นโอเพนซอร์สให้ไปพัฒนาต่อ

ที่มา – DeepMind

No Description

from:https://www.blognone.com/node/127595

DeepMind เปิดตัว AlphaCode ปัญญาประดิษฐ์เขียนโค้ด เข้าแข่งเขียนโปรแกรมได้คะแนนปานกลาง

DeepMind เปิดตัว AlphaCode ปัญญาประดิษฐ์เขียนโค้ด โดยอาศัยเพียงอินพุตเป็นโจทย์เหมือนการทดสอบเขียนโค้ดทั่วๆ ไปที่มีคำบรรยาย และตัวอย่างอินพุตกับเอาท์พุตของโปรแกรมให้เท่านั้น ผลทดสอบบนแพลตฟอร์ม Codeforces ปรากฎว่า AlphaCode มีความสามารถเขียนโปรแกรมในระดับปานกลาง (median) เมื่อเทียบกับผู้ร่วมแข่งขันอื่นๆ ที่เป็นมนุษย์

No Description

ตัว AlphaCode เองเป็นปัญญาประดิษฐ์ในกลุ่ม Transformer ที่ใช้ประมวลผลด้านภาษาเป็นหลัก แล้วฝึกปัญญาประดิษฐ์ด้วยโค้ดจำนวนมากถึง 715.1GB จาก GitHub โดยเลือกโค้ดภาษายอดนิยม ได้แก่ C++, C#, Go, Java, JavaScript, Lua, PHP, Python, Ruby, Rust, Scala, และ TypeScript ทีมงานพบว่าการใส่โค้ดเท่านี้ตรงๆ ก็ทำให้ปัญญาประดิษฐ์เขียนโปรแกรมง่ายๆ ได้แล้ว

แต่เพื่อพัฒนาปัญญาประดิษฐ์ต่อ ทีมงานดูดข้อมูลจากการแข่งขันต่างๆ ขึ้นมาเป็นชุดข้อมูล CodeContests โดยรวมจาก Codeforces, Description2Code, และ CodeNet โดยต้องระวังว่าจะไม่มีโจทย์ข้อใดที่ปัญญาประดิษฐ์เคยเห็น ด้วยการแบ่งชุด validation ให้เป็นโจทย์ที่ใหม่ที่สุด ข้อมูลการฝึกนี้ใส่ทั้งตัวโจทย์เอง, ข้อมูลอินพุตตัวอย่าง, ข้อมูลทดสอบที่ปกติจะไม่เห็นระหว่างการทดสอบ, คำตอบจากผู้เข้าแข่งขันทั้งที่ถูกและผิด ปัญหาสำคัญคือข้อมูลทดสอบไม่มากพอ ทำให้หลายครั้งการตรวจโค้ดมองว่าคำตอบถูกทั้งที่ตำตอบผิด หรือบางครั้งโค้ดก็ช้าเกินไป ทางแก้ของทีมงานคือการสร้างชุดตรวจคำตอบจากโปรแกรมที่ถูกต้องเพิ่มเติม

No Description

DeepMind สร้างโมเดลปัญญาประดิษฐ์ AlphaCode มาหลายตัว และแต่ละตัวเมื่อใส่อินพุตเป็นโจทย์เข้าไปแล้วก็สามารถสร้างโค้ดคำตอบออกมาได้นับพันรูปแบบ จากนั้นก็นำโค้ดคำตอบที่ได้มากรองด้วยตัวอย่างอินพุตในโจทย์เอง ก็จะกรองคำตอบที่ AlphaCode สร้างออกมาได้ถึง 99% (บางข้อก็ไม่มีคำตอบไหนผ่านเลย) ที่เหลือจะนำโค้ดคำตอบมาจับกลุ่มที่ด้วยการสร้างอินพุตเพิ่มเติม แล้วดูว่าโค้ดคำตอบกลุ่มใดให้เอาท์พุตเหมือนๆ กันบ้าง แล้วเลือกส่งโค้ดคำตอบจากกลุ่มที่ใหญ่ที่สุดก่อนเสมอ เนื่องจากโค้ดคำตอบที่ผิดสามารถผิดได้หลากหลายรูปแบบ จึงมักไม่จับกลุ่มกัน หากส่งตรวจแล้วพบว่าผิดก็เลือกโค้ดคำตอบจากกลุ่มที่เล็กลงเรื่อยๆ

No Description

ผลสุดท้ายของการทดสอบคือการส่ง AlphaCode เข้าร่วมทดสอบการแข่งขัน Codeforce ในช่วงสัปดาห์ที่ผ่านมาทั้งหมด 10 รอบ แล้วดูคะแนนที่ได้ ผลพบว่า AlpahCode ทำคะแนนได้ในกลุ่ม 54% แรกของผู้เข้าแข่งขันทั้งหมด นับว่าใกล้เคียงระดับผู้เข้าแข่งขันระดับกลางๆ แล้ว

AlphaCode ที่เข้าร่วมแข่งขันใช้ 3 บัญชี คือ SelectorUnlimited, WaggleCollide, และ AngularNumeric สามารถเข้าไปดูคำตอบที่ AlphaCode ส่งเข้าแข่งขันได้

ที่มา – DeepMind

from:https://www.blognone.com/node/126989

DeepMind เปิดตัวปัญญาประดิษฐ์ Gopher ใหญ่กว่า GPT-3 ถึง 60% ถามตอบใกล้เคียงมนุษย์, แต่มั่นใจเกินตัว

DeepMind เปิดตัวปัญญาประดิษฐ์สถาปัตยกรรมใหม่สำหรับการทำความเข้าใจภาษามนุษย์ โดยทดสอบสถาปัตยกรรมนี้หลายขนาด ตั้งแต่ 44 ล้านพารามิเตอร์ไปจนถึง 280,000 ล้านพารามิเตอร์ โดยตั้งชื่อโมเดลใหญ่ที่สุดนี้ว่า Gopher ซึ่งใหญ่กว่าโมเดล GPT-3 ของ OpenAI ถึง 60%

Gopher ทำคะแนนทดสอบความเข้าใจภาษา (Massive Multitask Language Understanding – MMLU) ได้เหนือกว่า GPT-3 แทบทุดหมวด บางหมวดเช่นมนุษยศาสตร์นั้นเริ่มเข้าใกล้คนจริงๆ (คะแนนสูงกว่า 70 คะแนนเทียบกับมนุษย์ที่ได้ประมาณ 90 คะแนน)

ทาง DeepMind ยกตัวอย่างบทสนทนาถามตอบเรื่องเซลล์ ตัว Gopher สามารถตอบคำถามได้อย่างตรงประเด็น ได้ใจความ แต่ขณะเดียวกันก็รายงานปัญหาว่า Gopher นั้นไม่สามารถแสดงความไม่แน่ใจเวลาที่หาคำตอบไม่ได้ แต่กลับให้คำตอบอย่างผิดๆ ออกมาแทน

งานวิจัยครั้งนี้ DeepMind ออกรายงานถึงความเสี่ยงของโมเดลปัญญาประดิษฐ์ด้านภาษาขนาดใหญ่ออกมาพร้อมกัน โดยระบุความเสี่ยง 6 ด้าน ได้แก่

  • ปัญญาประดิษฐ์ใช้ภาษาเหยียด
  • ตัวปัญญาประดิษฐ์ทำข้อมูลหลุด
  • ปัญญาประดิษฐ์สร้างข้อมูลเท็จหรือชี้นำผิด
  • ปัญญาประดิษฐ์ถูกมนุษย์ใช้เป็นเครื่องมือด้านมืด
  • มนุษย์เชื่อใจปัญญาประดิษฐ์เกินไป มองว่าเป็นมนุษย์
  • ผลกระทบด้านสิ่งแวดล้อมและเศรษฐกิจจากปัญญาประดิษฐ์ (ทำให้คนตกงาน หรือเหลือแต่ทงานที่แยกลง)

ที่มา – DeepMind

from:https://www.blognone.com/node/126231

Alphabet ตั้งบริษัทใหม่ Isomorphic Labs ใช้ AI วิจัยยา ใช้อัลกอริทึมจาก DeepMind

Alphabet ประกาศตั้งบริษัทใหม่ชื่อ Isomorphic Labs มีเป้าหมายเพื่อปฏิวัติวงการยาด้วย AI โดยใช้ AlphaFold 2 อัลกอริทึมทำนายการพับตัวของโปรตีนจากบริษัท DeepMind

Demis Hassabis ซีอีโอของ DeepMind จะมานั่งเก้าอี้ควบเป็นซีอีโอของ Isomorphic Labs ด้วย เขาบอกว่าที่ผ่านมา DeepMind มีผลงานวิจัยด้าน AI มากมาย ตอนนี้ได้เวลานำมาประยุกต์ใช้กับอุตสาหกรรมอื่นๆ แล้ว ซึ่งเขามองว่าวงการชีววิทยาและการแพทย์เป็นเป้าหมายแรก

ชื่อ Isomorphic Labs หมายถึงการเชื่อมต่อกันระหว่าง biology และ information science เป็นความพยายามใช้คณิตศาสตร์มาแก้ปัญหาชีววิทยาที่ซับซ้อน โดย AlphaFold2 เป็นแค่ตัวอย่างแรก แต่จะมีอย่างอื่นๆ ตามมาอีก

ที่มา – Isomorphic Labs

No Description

from:https://www.blognone.com/node/125683

DeepMind ซื้อซอฟต์แวร์จำลองฟิสิกส์ MujoCo แจกให้ใช้ฟรีทันที เตรียมโอเพนซอร์สปีหน้า

DeepMind บริษัทปัญญาประดิษฐ์ของกูเกิลประกาศเข้าซื้อ MuJoCo (Multi-Joint dynamics with Contact) ผู้ผลิตซอฟต์แวร์จำลองระบบฟิสิกส์ในโลกความเป็นจริง จากเดิมเป็นซอฟต์แวร์ของบริษัท Roboti LLC ตอนนี้ทาง DeepMind ประกาศให้ใช้งานได้ฟรีทันที

ตัวโครงการ MuJoCo ที่จริงแล้วเป็นไลบรารีในภาษา C และสามารถอ่านข้อมูลโลกจำลองในฟอร์แมต MJCF ที่เป็นภาษา XML สำหรับการสร้างโลกจำลอง เช่น ลูกข่างที่กำลังหมุน, หรือลูกตุ้มที่แกว่งไปมาจากการแขวนบนเส้นด้าย ความแตกต่างของ MuJoCo กับระบบฟิสิกส์ในเกมเอนจินคือมันถูกออกแบบเพื่อความแม่นยำเป็นหลัก ไม่ใช่ประสิทธิภาพหรือเสถียรภาพ ทำให้มันสามารถจำลองระบบที่ซับซ้อนเช่น ลูกตุ้มแกว่งของนิวตัน (Newton’s Cradle) หรือการรักษาโมเมนตัมเชิงมุมของวัตถุ

เป้าหมายหนึ่งของการวิจัยปัญญาประดิษฐ์ทุกวันนี้คือการจำลองระบบควบคุมทางกายภาพ ที่ปัญญาประดิษฐ์ต้องควบคุมหุ่นยนต์และรับมือกับความเปลี่ยนแปลงในโลกความเป็นจริง โดยทั่วไปแล้วการฝึกปัญญาประดิษฐ์สามารถทำได้ด้วยการสร้างโลกจำลองในคอมพิวเตอร์เพื่อฝึกปัญญาประดิษฐ์อย่างหนักเหมือนได้ฝึกทำตามเป้าหมายในโลกความเป็นจริงนับหมื่นนับแสนครั้ง ระบบจำลองทางฟิสิกส์ที่มีความแม่นยำสูงจึงจำเป็นสำหรับการฝึกเช่นนี้

ตอนนี้ทาง DeepMind ยังเปิดให้ใช้งานเฉพาะไบนารีที่คอมไพล์มาแล้วได้ฟรี และจะจัดระเบียบซอร์สโค้ดอีกครั้งก่อนจะเปิดซอร์สออกมาในปี 2022

ที่มา – DeepMind

No Description

ภาพ Newton’s Cradle ที่จำลองใน MuJoco

Topics: 

from:https://www.blognone.com/node/125334

DeepMind เสนอโมเดลทำนายรูปร่างโปรตีนแบบหลายเส้น ได้ความแม่นยำระดับปานกลางเป็นส่วนใหญ่

DeepMind ยังคงเดินหน้าวิจัยสร้างปัญญาประดิษฐ์สำหรับทำนายรูปร่างโปรตีน หลังจากปีที่แล้ว AlphaFold สามารถทำนายโครงสร้างโปรตีนได้อย่างแม่นยำระดับเดียวกับการทดลอง งานวิจัยล่าสุดของ DeepMind ก็หันมาพยายามทำนายโครงสร้างโปรตีนที่มีหลายห่วงโซ่ (multi-chain protein) ที่ยังทำนายโครงสร้างได้ยากอยู่

โมเดลปัญญาประดิษฐ์ใหม่นี้ชื่อว่า AlphaFold-Multimer ที่ยังฝึกกับชุดข้อมูล Protien Data Bank (PDB) อยู่ แต่ตัดส่วนชองโปรตีนทีละไม่เกิน 384 ส่วน (residue) มาฝึกปัญญาประดิษฐ์หาโครงสร้าง เพื่อฝึกให้หาโครงสร้างจุดเชื่อมต่อระหว่างสายโปรจีน (multimeric interfaces) จากนั้นทดสอบโมเดลปัญญาประดิษฐ์กับชุดข้อมูลเฉลย และวัดคะแนนความแม่นยำแบบ DockQ ที่ระบุว่าคะแนน 0.23 ลงไปถือว่าทำนายผิด และ 0.8 ขึ้นไปถือว่าแม่นยำมาก

จากชุดข้อมูลทดสอบ Benchmark 2 ที่มีชุดโปรตีน 17 ตัว AlphaFold-Multimer สามารถทำนายได้แม่นยำ 6 ตัว ปานกลาง 8 ตัว และผิดพลาด 3 ตัว โดยทีมงานพบว่ายังไม่สามารถทำนายโครงสร้างของการจับแอนติบอดี (binding of antibodies) ได้ดีนัก

ที่มา – DeepMind

alt="Deepmind Predict Protein"

from:https://www.blognone.com/node/125150

DeepMind โชว์โมเดล AI พยากรณ์อากาศระยะสั้น 2 ชม. บอกได้ว่าฝนจะตกหรือไม่

DeepMind บริษัท AI ในเครือ Alphabet ประกาศความร่วมมือกับสำนักงานอุตุนิยมวิทยาของสหราชอาณาจักร (Met Office) สร้างอัลกอริทึมที่พยากรณ์อากาศได้แม่นยำในช่วงเวลาสั้นๆ (Nowcasting) เช่น บอกล่วงหน้าได้ก่อน 2 ชั่วโมงว่าจะมีฝนตกหรือไม่

โมเดลพยากรณ์อากาศในปัจจุบันใช้ระบบที่เรียกว่า numerical weather prediction (NWP) เป็นการพยากรณ์สภาพอากาศทั้งโลก (planet-scale) ล่วงหน้าเป็นเวลานานหลายวัน ปัญหาของโมเดลแบบเก่าคือพยากรณ์อากาศระยะสั้นไม่ได้

โมเดลใหม่ของ DeepMind เป็นการนำข้อมูลจากเรดาร์ตรวจอากาศความละเอียดสูง วัดค่าบ่อยๆ (เช่น วัดค่าในพื้นที่ 1 ตารางกิโลเมตรทุก 5 นาที) มาใช้พยากรณ์อากาศล่วงหน้าสั้นๆ ไม่เกิน 2 ชั่วโมง

DeepMind บอกว่าโมเดลของตัวเอง (ชื่อทางเทคนิคคือ DGMR หรือ Deep Generative Model for Rainfall) ได้รับการยอมรับจากนักพยากรณ์อากาศของ Met Office ว่ามีความแม่นยำกว่าโมเดลพยากรณ์อื่นๆ ที่ใช้ deep learning ในปัจจุบันอย่าง PySTEPS และ Unet (แต่ก็ยังเป็นการเปรียบเทียบกับข้อมูลสภาพอากาศย้อนหลังในปี 2019 เพียงกรณีเดียว)

บริษัทตีพิมพ์เปเปอร์วิจัยใน Nature ซึ่งสามารถเข้าไปอ่านกันได้ฟรี รวมถึงเผยแพร่โมเดลและชุดข้อมูลบน GitHub ด้วย

No Description

No Description

ที่มา – DeepMind

from:https://www.blognone.com/node/125017

สโสมร Liverpool จับมือ DeepMind บุกเบิกการใช้ AI ช่วยวิเคราะห์เกมฟุตบอล

DeepMind บริษัท AI ในเครือ Alphabet ที่เรารู้จักกันดีจาก AlphaGo เริ่มบุกไปยังวงการใหม่คือ “ฟุตบอล” โดยร่วมกับสุดยอดสโมสรฟุตบอลจากอังกฤษ Liverpool FC ทำวิจัยเรื่องการนำ AI มาใช้งานในวงการฟุตบอล

นักวิจัยจากทั้งสองหน่วยงานทำงานร่วมกันมาสักระยะหนึ่ง แล้วเพิ่งตีพิมพ์เปเปอร์วิจัยชื่อ Game Plan:
What AI can do for Football, and What Football can do for AI ที่รวบรวมผลลัพธ์ (เบื้องต้น) ว่าสามารถนำ AI มาใช้กับเกมกีฬาได้อย่างไรบ้าง

ข้อสรุปเบื้องต้นของทีมวิจัยคือ การนำ AI มาใช้กับฟุตบอลแบ่งออกเป็น 3 แขนง ได้แก่

  • Computer Vision (CV) เช่น การวิเคราะห์ฟุตเตจการแข่งขัน
  • Statistical Learning (SL) การดูจากสถิติเก่าของนักเตะแล้วนำมาวิเคราะห์
  • Game Theory (GL) การนำทฤษฎีเกมมาใช้วิเคราะห์บางส่วนของการแข่งขัน เช่น การเตะลูกโทษ

เป้าหมายสุดท้ายคือใช้ศาสตร์ทั้ง 3 แขนงมาร่วมกันสร้าง Automated Video Assistant Coach (AVAC) หรือโค้ชผู้ช่วยที่เป็น AI คอยช่วยโค้ชที่เป็นมนุษย์จริงๆ อีกทีหนึ่ง

No Description

ภาพจาก Liverpool FC

งานวิจัยนี้ใช้ข้อมูลจากเกมการแข่งขันของ Liverpool ในพรีเมียร์ลีกทุกนัด ระหว่างปี 2017-2019 มาวิเคราะห์ และได้ข้อมูลเบื้องต้นหลายอย่าง เช่น เราสามารถพยากรณ์การเคลื่อนไหวของผู้เล่นบางคนได้จากสถิติในอดีต หรือ การวิเคราะห์การเตะจุดโทษ 12,000 ครั้งจากหลายลีกในยุโรป เพื่อวิเคราะห์ว่าผู้เล่นมักเตะด้วยเท้าข้างที่ถนัดหรือไม่ (ผลคือ ผู้เล่นตำแหน่งศูนย์หน้ามักเล็งมุมซ้ายล่าง มากกว่าผู้เล่นตำแหน่งกองกลาง)

ทีม DeepMind บอกว่างานศึกษาชิ้นนี้ยังเป็นแค่การเริ่มต้นของการนำ AI มาใช้ในการแข่งกีฬาเท่านั้น และจะศึกษาต่อเพิ่มเติมอีกในอนาคต

Karl Tuyls นักวิจัยหลักของงานชิ้นนี้ และ Demis Hassabis ผู้ก่อตั้ง DeepMind ล้วนแต่เป็นแฟน Liverpool

ใครสนใจสามารอ่านเปเปอร์ฉบับเต็ม

No Description

No Description

ที่มา – DeepMind, Wired UK

from:https://www.blognone.com/node/122620

DeepMind รายงานความก้าวหน้าปัญญาประดิษฐ์ MuZero เล่นเกม Atari ให้ชนะได้ แม้ไม่รู้กติกา

DeepMind เผยแพร่ความคืบหน้าของปัญญาประดิษฐ์ MuZero ที่พัฒนาต่อจาก AlphaZero โดยตั้งเป้าหมายเพื่อหาอัลกอริทึมสำหรับโจทย์แบบไม่เจาะจง สามารถเอาชนะในเกมใด ๆ ก็ตาม ที่ไม่รู้กฎกติกามาก่อน

ที่ผ่านมาปัญญาประดิษฐ์ของ DeepMind จะแก้ปัญหาได้เฉพาะเรื่อง (Domain) และอาศัยองค์ความรู้ (Knowledge) ทั้งข้อมูลการเล่นในอดีต จนถึงกติกาการเล่น ซึ่งแนวทางนี้จะพบปัญหาเมื่อต้องเล่นเกมแบบ Atari ที่รูปแบบกติกาไม่ได้บอกชัดเจนมาก และเกมก็ซับซ้อนขึ้น (ดูภาพประกอบด้านล่าง)

DeepMind อธิบายเพิ่มเติมว่าปัญญาประดิษฐ์แบบนี้ ถอดแบบจากการคิดแก้ปัญหาของมนุษย์มากขึ้น เช่น เมื่อเราเจอเมฆครึ้ม เราก็จะเดาว่าฝนน่าจะตก (Predict) และหยิบร่มติดตัวเพื่อไม่ให้เปียกฝน (Decide) ระบบการคิดดังกล่าวเป็นการตัดสินใจจากสภาพที่เผชิญอยู่ตอนนั้น ไม่ใช่การดูภาพรวมทั้งหมด (เช่นการดูสภาพอากาศรวมทั้งแผนที่) โดย MuZero ใช้ 3 องค์ประกอบหลักในการตัดสินใจคือ คุณค่าของตำแหน่งปัจจุบัน (Value), การกระทำที่ดีที่สุด (Policy) และผลลัพธ์จากการกระทำก่อนหน้า (Reward)

ตัวอย่างที่ DeepMind นำมาอธิบายคือเกม Ms Pac-Man พบว่ายิ่งให้เวลาตัดสินใจต่อครั้งมากขึ้น ผลลัพธ์ก็ดีขึ้นตาม เช่นเดียวกับจำนวนทางเลือก หากให้ทางเลือกที่มากขึ้น ผลลัพธ์ก็ดีขึ้นเช่นกัน และแม้จำกัดทางเลือกต่อครั้งเหลือเพียง 6-7 วิธี ซึ่งน้อยมาก ผลลัพธ์ในการเล่นเกมก็ยังออกมาดี

ที่มา: DeepMind และ Engadget

alt="DeepMind MuZero"

MuZero

from:https://www.blognone.com/node/120270