การอัปเดต Google BERT เป็นอย่างไร? – รับทำ SEO

SEO 2020 มีอะไรบ้างhttp://seolnw99.blogsmine.com/46247/seo-2020. « การอัปเดต Google BERT คืออะไร? – รับทำ SEO », »วัสดุค้นหาขนาดใหญ่ซึ่งเป็นที่ชื่นชอบกันอย่างแพร่หลาย เช่น Google ย่อมมีการปรับปรุงแก้ไขกระบวนการทำงานอยู่อย่างสม่ำเสมอ เพื่อให้สามารถตอบสนองต่อผู้ใช้งานได้อย่างมีประสิทธิภาพ หนึ่งสำหรับในการอัปเดตที่สำคัญที่สุดเมื่อเร็วๆนี้ก็คือ BERT ซึ่งการอัปเดตนี้มีความสำคัญยังไง? มีกระบวนการทำงานยังไง? รวมทั้งเราจะได้ประโยชน์อะไรบ้าง? นั่นคือสิ่งที่เราต้องหาคำตอบจากเนื้อหานี้Google BERT (Bidirectional Encoder Representations from Transformers) คือ การเข้ารหัสแบบสองแนวทางโดย Transformers แล้วก็เป็นการแก้ไข Algorithm (ขั้นตอนการแก้ปัญหาอย่างมีขั้นตอน) การค้นหาหลัก ซึ่งเน้นไปที่การปรับแก้ความสามารถสำหรับในการทำความเข้าใจด้านภาษาของ GoogleBERT เป็นหนึ่งสำหรับในการอัปเดตที่ใหญ่ที่สุดของ Google ที่มาพร้อมกับ RankBrain (ระบบปัญญาประดิษฐ์ของ Google) ในปี 2558 ซึ่งบรรลุเป้าหมายสำหรับการทำความเข้าใจเจตนาของผู้ค้นหาผ่านทางคำค้นหาGoogle BERT มีการดำเนินการอย่างไร?ลองมาทำความเข้าใจกันจากตัวอย่างนี้เจตนาของผู้ค้นหาคือ สามารถให้ใครซักคนรับใบสั่งยาแทนผู้เจ็บป่วยได้หรือเปล่า?และนี่คือผลการค้นหาของ Google ก่อนจะมีการใช้ BERTผลของการค้นหานั้นจะไม่ตรงกับสิ่งที่ผู้ค้นหาปรารถนา เหตุเพราะ Google ไม่สามารถที่จะประเมินผลคำว่า « someone » (บางบุคคล) สำหรับเพื่อการค้นหาได้และนี่เป็นคำตอบภายหลัง BERT ได้ถูกรวมเข้าใน Algorithm หลักของการค้นหาแล้วผลการค้นหานี้ตอบปัญหาของผู้ค้นหาได้อย่างเที่ยงตรง เนื่องจาก Google ได้รู้เรื่องความหมายของคำว่า « someone » ในบริบทที่ถูกต้องแล้ว ภายหลังจากการประมวลเนื้อความค้นหาทั้งผองแทนที่จะประเมินผลครั้งละคำ และไม่ให้น้ำหนักไปกับบางคำ ดังเช่น « someone » ในบริบทส่วนตัวBERT ช่วยทำให้ Google ประเมินผลทุกคำในเนื้อความค้นหา และกำหนดรูปแบบของแต่ละคำ ทำให้เห็นผลลัพธ์ที่ถูกต้องเพิ่มขึ้นอีกแบบอย่างหนึ่ง คือ ใจความค้นหาว่า « math practice book for adults » ซึ่งผู้ค้นหาปรารถนาซื้อหนังสือฝึกหัดเลขคณิตสำหรับผู้ใหญ่ก่อนที่จะมีการใช้ระบบ BERT ผลสรุปออกมาเป็นการชี้แนะหนังสือสำหรับชั้นมัธยมต้น ซึ่งไม่ตรงตามความอยากของผู้ค้นหา เหตุเพราะในคำชี้แจงจากคำตอบมีการใช้วลีว่า « young adult » ซึ่งหมายถึงคนหนุ่มสาว ไม่ใช่คำว่า « adult » ที่หมายถึงผู้ใหญ่ แล้วก็ในบริบทการค้นหานี้ « young adult » นั้นไม่เกี่ยวข้องกับปัญหาหลังจากใช้ระบบ BERT แล้ว Google สามารถแยกแยะความต่างของคำว่า « young adult » และก็คำว่า « adult » ได้อย่างถูกต้อง และก็มีผลที่ถูกต้องออกมาGoogle NLP คืออะไร? แล้วก็มีการดำเนินงานเช่นไร?NPL ย่อมาจาก Natural Language Processing ซึ่งเป็นส่วนย่อยของปัญญาประดิษฐ์ ประกอบด้วยการเล่าเรียนของอุปกรณ์และก็การศึกษาเล่าเรียนในด้านภาษา สิ่งนี้ทำให้การสื่อสารระหว่างคอมพิวเตอร์กับมนุษย์เป็นไปด้วยภาษาที่ฟังดูแล้วเป็นธรรมชาติNPL เป็นเทคโนโลยีที่อยู่เบื้องหลังแอปพลิเคชันทางภาษาที่ได้รับความนิยมหลายอย่าง อย่างเช่น– Google Translate– Microsoft Word– Grammarly– OK Google, Siri, Cortana แล้วก็ Alexaในการเรียกใช้โปรแกรมทางด้านภาษาของ Google จะประกอบด้วยบริการ 5 อย่าง ดังต่อไปนี้1. การวิเคราะห์ไวยากรณ์Google จะแบ่งข้อความค้นหาออกเป็นคำเดี่ยวๆแล้วก็แยกข้อมูลทางภาษาสำหรับแต่ละคำอย่างเช่น ใจความค้นหาว่า « who is the father of science? » หรือ « คนไหนกันเป็นบิดาที่วิทยาศาสตร์? » ก็จะถูกแบ่งย่อยผ่านการวิเคราะห์ไวยากรณ์ในแต่ละคำ ดังเช่นว่าWho เป็น สรรพนามIs แสดงจำนวนซึ่งเป็นเอกพจน์ ก็เลยตีความหมายว่าเป็น เอกพจน์The เป็น ตัวกำหนด Father มีหนึ่งคำนาม ก็เลยตีความหมายว่าเป็น เอกพจน์Of เป็น คำบุพบทScience เป็น คำนาม2. การวิเคราะห์ความรู้สึกระบบการวิเคราะห์ความรู้สึกของ Google ระบุคะแนนทางอารมณ์ให้กับเนื้อความค้นหาด้วย ดังเช่นจะเห็นได้ว่านอกจากจะมีตัวเลขบอกถึงคะแนนแล้ว ยังกำหนดได้เพราะว่าข้อความค้นหานั้นมีอารมณ์ในเชิงบวก หรือแง่ลบ หรือเป็นเพียงแต่ปัญหาธรรมดาที่ไม่แสดงถึงอารมณ์อะไรก็ตามเลยข้อควรรู้: แบบอย่างข้างต้นเป็นเพียงแต่การสุ่มขึ้นมา เพื่อคุณเข้าใจแนวคิดของการวิเคราะห์ความรู้สึกของ Google ซึ่ง Algorithm ที่ Google ใช้จริงนั้นเป็นความลับ และบางทีอาจผิดแผกออกไปจากนี้3. การวิเคราะห์เอกลักษณ์ในขั้นตอนนี้ Google จะเก็บเอกลักษณ์จากใจความค้นหา และใช้ Wikipedia เป็นฐานข้อมูลสำหรับเพื่อการค้นหาเอกลักษณ์นั้นจากเนื้อความค้นหาได้แก่ เนื้อความค้นหา « Selena Gomez อายุมากแค่ไหน? »Google จะตรวจพบ « Selena Gomez » ว่าเป็นเอกลักษณ์ และส่งคำตอบจาก Wikipedia ออกมา4. การวิเคราะห์ความน่านับถือของผลลัพธ์Google ก้าวไปอีกขั้นด้วยการระบุความน่านับถือโดยรวมให้กับผลสรุป ในตอนที่มีการประมาลผลเว็บเพจ Google จะกำหนดความน่านับถือให้กับผลลัพธ์แต่ละรายการโดยขึ้นอยู่กับวิธีการใช้งานที่เกี่ยวข้องกับด้านเอกสารที่เป็นผลลัพธ์นั้น การให้แต้มความน่าวางใจนี้คล้ายกับการให้คะแนนในกรรมวิธีวิเคราะห์ความรู้สึก5. การแบ่งแยกพวกใจความลองนึกภาพฐานข้อมูลขนาดใหญ่ที่มีการจำแนกข้อมูลต่างๆออกเป็นหมวดหมู่ไว้ ดังเช่นว่า DMOZ (แหล่งรวมข้อมูลที่ได้มาจากลิงก์ World Wide Web) เมื่อเริ่มใช้งาน DMOZ จะจัดเว็บออกเป็นหมวดหมู่ แล้วก็หมวดย่อย แล้วก็ย่อยลงไปอีกเยอะแยะเพื่อความสบายในการค้นหาGoogle จะจับคู่หมวดหมู่ย่อยกับเว็บเพจที่เหมาะสม ตามเนื้อความค้นหาที่ผู้ใช้งานเจาะจงลงไปอย่างเช่น มีใจความค้นหาว่า « design of a butterfly » (การออกแบบผีเสื้อ) Google อาจเจาะจงหมวดย่อยออกมาหลายชนิด เช่น « modern art », « digital art », « artistic design », « illustration », « architecture » แล้วก็อื่นๆก่อนที่จะเลือกหมวดหมู่ย่อยที่เยี่ยมที่สุดอีกทีGoogle เคยกล่าวไว้ว่า: « หนึ่งในความท้าที่สุดของการประมวลผลภาษาธรรมชาติ (NLP) เป็น การขาดแคลุกลี้ลุกลนข้อมูลสำหรับในการฝึกฝน เนื่องจากว่า NPL มีขอบเขตงานที่หลากหลาย รวมทั้งมีความแตกต่างกันสูง ชุดข้อมูลเฉพาะทางที่มีชอบได้รับการฝึกซ้อมจากมนุษย์ไม่มากนัก »เพื่อแก้ไขปัญหาการขาดแคลนลานข้อมูลในการฝึกซ้อม Google ได้ปฏิบัติงานขั้นต่อไปด้วยการออกแบบ Google AutoML Natural Language ที่ช่วยให้ผู้ใช้งานสามารถสร้างรูปแบบการเรียนได้ด้วยอุปกรณ์ที่กำหนดเอง ซึ่ง BERT ของ Google นั้นก็เป็นส่วนเสริมของ Google AutoML Natural Languageข้อควรทราบ: Google BERT นั้นไม่ใช่กรรมวิธีการปรับปรุงข้อความค้นหา แต่ว่าเป็นกระบวนการรู้เรื่องบริบทของข้อความค้นหาเพื่อนำไปจับคู่กับใจความที่ตรงกันบนเว็บเพจต่างๆแล้วนำเสนอออกมาสำเร็จลัพธ์BERT NLP เป็นยังไง?BERT นั้นเป็นลักษณะของการนำไปใช้งานที่ให้โอกาสให้ผู้ใช้งานทุกคนเข้าถึงได้ และก็เป็นส่วนเพิ่มเติมของ Google AutoML Natural Language ตามที่อธิบายไว้ข้างต้น ซึ่ง BERT จะเป็นวิธีสำหรับในการเพิ่มประสิทธิภาพให้กับ NPL ในปีถัดๆไปGoogle ได้กล่าวไว้ว่า: »พวกเราได้เปิดตัวเคล็ดวิธีใหม่สำหรับการฝึกฝน NLP ที่เรียกว่า Bidirectional Encoder Representations from Transformers หรือ BERT และก็ด้วยการเปิดตัวนี้ ทุกคนบนโลกสามารถฝึกฝนได้จากระบบตอบคำถามที่ล้ำสมัย ด้วยเวลา 30 นาทีบน single Cloud TPU (หน่วยประเมินผลปัญญาประดิษฐ์ของ Google) หรือ ไม่กี่ชั่วโมงบน single GPU (หน่วยประมวลผลกราฟฟิก 3 มิติ) »BERT นั้นชี้ให้เห็นถึงยุคสมัยใหม่ของ NLP แล้วก็บางทีอาจเป็นสิ่งที่สุดยอดที่สุดเท่าที่เคยสร้างมาBERT ช่วยสำหรับในการประเมินผลใจความค้นหาที่เป็นประโยคพูดคุยGoogle BERT มีจุดประสงค์เพื่อการประมวลผลใจความค้นหาที่เป็นประโยคเจรจา เนื่องด้วยGoogle ได้กล่าวไว้ว่า: « โดยเฉพาะสำหรับข้อความค้นหาที่เป็นประโยคสนทนา หรือการค้นหาที่มีคำบุพบท อาทิเช่น « for » และก็ « to » เนื่องจากว่าสองคำนี้มีความหมายที่ค่อนข้างหลากหลาย วัสดุค้นหานั้นจะสามารถรู้เรื่องบริบทของข้อความค้นหาของคุณได้ คุณจึงสามารถค้นหาได้ตามแบบที่คุณอยากได้ »แผนการในการคาดเดาคำต่อไปของใจความ อาทิเช่น « Feature-based » (ตามคุณลักษณะ) และก็ « Fine-tuning » (การปรับปรุงแก้ไข) ได้บอกให้เห็นถึงการปรับแก้กระบวนการประมวลผลทางภาษามาแล้วเยอะแยะBERT นั้นช่วยทำให้ปรับปรุงอุบาย « Fine-tuning » ด้วยการใช้ « masked language model » (MLM) ซึ่งจะสุ่มหลบซ่อนคำบางคำจากประโยคไว้ รวมทั้งเดาคำถัดไปจากบริบทนั้นGoogle ได้กล่าวไว้ว่า: »BERT นั้นเป็นต้นแบบการปรับปรุงแก้ไขเพื่อคุณภาพสำหรับในการทำงานสำหรับชุดข้อความขนาดใหญ่ หรือเนื้อความค้นหาที่มีเอกลักษณ์ ซึ่งดีมากกว่าส่วนประกอบการค้นหาในแบบอื่นๆเป็นแถวคิดที่เรียบง่าย และก็มีคุณภาพอันเป็นเป็นที่ยอมรับกันอย่างทั่วถึง ได้รับการยินยอมรับในด้าน NPL ใน 11 ชุดงาน รวมถึงวิธีการทำคะแนนจาก GLUE ได้ 80.5% (เพิ่มขึ้นมา 7.7%) ได้รับคะแนนความแม่นยำจาก MultiNLI 86.7% (มากขึ้นมา 4.6%) ได้รับคะแนนจาก SQuAD v1.1 question answering Test F1 93.2 คะแนน (มากขึ้นมา 1.5 คะแนน) รวมทั้งได้รับคะแนนจาก SQuAD v2.0 Test F1 83.1 คะแนน »จากคำศัพท์ทางเทคนิคมากมายก่ายกองนั้น สรุปหัวใจคว