คุณพระช่วย! นักวิจัยทดลองฝึก AI ให้เขียนรีวิวปลอม และผลที่ได้นั้นน่ากลัวยิ่งนัก

ความเห็นออนไลน์เป็นช่องทางแรกของคนสมัยนี้โดยเฉพาะเวลาที่พวกเขากำลังมองหาร้านอาหารและโรงแรม ดังนั้นพวกเขาจึงกลายเป็นส่วนสำคัญของธุรกิจจำนวนมาก เพราะคนเหล่านี้จะกลายมาเป็นบันทึกที่มีชีวิตที่อยู่ไปอีกนาน ในการบอกต่อคุณภาพของบริการและผลิตภัณฑ์ และธุรกิจเหล่านี้ก็ต้องตื่นตัวอยู่ตลอดเวลาเพื่อเฝ้าดูความคิดเห็นที่ไม่เป็นธรรมหรือรีวิวปลอมต่างๆ ที่ถูกสร้างขึ้นโดยคู่แข่งที่เล่นสกปรก หรือลูกค้าที่ไม่พอใจในสินค้าและบริการ แต่เร็วๆ นี้จะมีภัยคุกคามใหม่ที่สำคัญต่อโลกของการเขียนรีวิว นั่นคือการเขียนรีวิวปลอมโดยใช้ ปัญญาประดิษฐ์ (AI)

AI ต่างๆ ถูกพัฒนาเพิ่มขึ้นอย่างมากโดยไม่ได้ผ่านการตรวจสอบ ซึ่งมันสามารถทำให้เว็บไซต์รีวิวทั้งหลายเสียความน่าเชื่อถือลงไปเยอะ เทคโนโลยีจะมีขอบเขตที่กว้างขึ้นและน่าเป็นห่วงขึ้น ซึ่งอาจส่งผลกระทบต่อสังคม ความน่าเชื่อถือ และข่าวปลอมที่อาจเกิดมากขึ้นตามมา

Ben Y. Zhao ศาสตราจารย์ด้านวิทยาการคอมพิวเตอร์ แห่งมหาวิทยาลัยชิคาโก กล่าวว่า “นี่เป็นภัยคุกคามที่กำลังใหญ่ขึ้นเรื่อยๆ และกระจายตัวไปในสังคมที่กลุ่มผู้ใช้มีขนาดใหญ่และไม่ค่อยสนใจอะไร และมันจะสั่นคลอนความเชื่อมั่นของเราในการตัดสินว่าอะไรจริงอะไรไม่จริง”


รีวิวปลอมตรวจจับไม่ได้และถูกตัดสินแล้วว่ามีความน่าเชื่อถือ
นักวิจัยจากมหาวิทยาลัยชิคาโก รวมถึง Ben Zhao เอง ได้เขียนบทความเรื่อง “การโจมตีและการป้องกันของระบบรีวิวออนไลน์อัตโนมัติ” ซึ่งแสดงให้เห็นว่า AI สามารถนำมาใช้ในการพัฒนาการเขียนรีวิวที่ซับซ้อน ซึ่งไม่ใช่แค่ตรวจจับไม่ได้โดยวิธีการปัจจุบัน แต่ยังถือว่ามีความน่าเชื่อถือสูง โดยผู้อ่านโดยไม่รู้ตัว โดยบทความนี้จะนำเสนอในที่ประชุม ACM Computer and Communications Security ในปลายปีนี้

นี่เป็นตัวอย่างหนึ่งของรีวิวที่ถูกหยิบขึ้นมา: “ฉันรักที่นี่ ฉันไปกับพี่ชายของฉัน เรากินพาสต้ามังสวิรัติกันและมันอร่อยมากเลย เบียร์ก็ดีและบริการก็เจ๋งสุดๆ ฉันจะแนะนำที่นี่ให้กับคนที่กำลังมองหาสถานที่ที่เยี่ยมยอดสำหรับการรับประทานอาหารเช้าในที่เล็กๆ ที่มีการจัดการที่ดี”

ไม่มีอะไรแปลกในรีวิวนี้ มันให้คำแนะนำที่เฉพาะเจาะจงและเล่าเรื่องภูมิหลังที่น่าเชื่อ และแม้ว่าวลีสุดท้ายจะแปลกๆ นิดนึง (“ที่เล็กๆ ที่มีการจัดการที่ดี”) ก็ยังเป็นเรื่องที่เป็นไปได้ในการเรียงคำผิดของมนุษย์บางคน

อย่างไรก็ตามในความเป็นจริงมันถูกสร้างขึ้นโดยใช้เทคนิคการเรียนรู้ขั้นสูงที่เรียกว่า RNN หลังจากได้รับการฝึกฝนกับรีวิวออนไลน์หลายพันฉบับที่เกลื่อนอินเทอร์เน็ต นักวิจัยกล่าวถึงรีวิวด้านบนว่า “ไม่สามารถแยกแยะได้อย่างชัดเจน เราได้ทำการศึกษาจากผู้ใช้จริง (= 600 คน) และมันแสดงให้เราเห็นว่ารีวิวปลอมเหล่านี้ไม่เพียงแต่สามารถหลีกเลี่ยงการตรวจจับได้ แต่ผู้ใช้งานทั่วไปยังให้ความเห็นว่า เป็นรีวิวที่มีประโยชน์รีวิวหนึ่งอีกด้วย”

 

ซึ่งการที่มันถูกมองว่ามีประโยชน์นี่แหละที่เป็นเรื่องใหญ่ เพราะมันแสดงให้เห็นว่าพวกเขากำลังเติมเต็มความต้องการของตัวเองในความคิดเห็นของมนุษย์ที่ค่อนข้างเป็นไปในแง่ร้าย

รีวิวพวกนี้ถูกตรวจจับได้ยากมาก ต่อให้ใช้ซอฟต์แวร์ตรวจจับก็ตาม โดยเฉพาะอย่างยิ่งเมื่อมีการกำหนดให้มันมีเอกลักษณ์เฉพาะในแต่ละอัน เพราะแต่ละอันถูกเขียนขึ้นแบบเรียงอักขระใหม่แบบตัวต่อตัว แทนที่จะเป็นการเอารีวิวที่มีอยู่มาเรียงๆ ผสมๆ กันใหม่แบบง่ายๆ “มันยังคงเป็นเรื่องยากที่จะตรวจสอบรีวิวปลอม โดยซอฟท์แวร์ที่ปกติมีไว้ใช้เพื่อตรวจสอบการขโมยทรัพย์สินทางปัญญาก็ตาม ถ้ารีวิวนั้นไม่ได้มาจากการเอาของจริงมารวมๆ กัน” นักวิจัยกล่าว “นี่แสดงให้เห็นว่า RNN ไม่ได้เขียนรีวิวจากแค่การคัดลอกรีวิวที่ได้เรียนรู้จากตอนฝึก”


เทคโนโลยีนี้ยังไม่ได้ถูกนำไปใช้โดยคนจริงๆ
ตอนนี้มีอุตสาหกรรมใต้ดินของกลุ่มคนรับเขียนรีวิวปลอม หากคุณรู้แหล่งและมีเงินสดในแบงค์เยอะหน่อย คุณก็สามารถจ่ายเงินให้คนเขียนความคิดเห็นในเชิงบวกสำหรับธุรกิจของคุณหรือ เขียนรีวิวลบๆ สำหรับคู่แข่งได้สบายๆ แต่รีวิวที่สร้างโดย AI จะเข้ามาทำลายอุตสาหกรรมนี้ในอนาคต Zhao กล่าว

ในขณะที่เมื่อก่อนต้องจ่ายเงินเรื่อยๆ เพื่อให้ได้รีวิวที่มีคุณภาพสูง แต่ต่อไปพวกเขาจะสามารถสร้างรายได้เป็นพันๆ ได้โดยไม่เสียค่าใช้จ่าย และลดตัวแปรอื่นๆ ที่เกี่ยวข้องออกไปเพื่อไม่ให้เกิดความสงสัยว่าเป็นรีวิวปลอม

Zhao กล่าวว่าเขายังไม่ได้เห็นตัวอย่างของ AI ที่ใช้ในการสร้างรีวิวปลอมขึ้นมาเพื่อใช้งานจริงในตอนนี้ แต่ก็ต้องใช้คนที่ “มีความเชี่ยวชาญทางเทคนิค” เพื่อสร้างระบบที่คล้ายคลึงกันกับที่นักวิจัยพัฒนาขึ้น โดยไม่ต้องใช้อะไรมากนอกจากฮาร์ดแวร์คอมพิวเตอร์และฐานข้อมูลรีวิวจริงจำนวนหนึ่งซึ่งสามารถพบได้ทั่วไปทางออนไลน์

Ben Y. Zhao ศาสตราจารย์ด้านวิทยาการคอมพิวเตอร์ แห่งมหาวิทยาลัยชิคาโก

มันเป็นภัยคุกคามต่อเว็บไซต์รีวิว แต่ยังพอมีทางป้องกันอยู่
รีวิวปลอมที่เกิดขึ้นในระดับอุตสาหกรรมถือเป็นภัยคุกคามที่สำคัญต่อบริษัทต่างๆ เช่น เว็บไซต์รีวิว Yelp ที่วางตัวเองไว้ในตำแหน่งของความน่าเชื่อถือและรีวิวที่มีประโยชน์ หากเกิดการตรวจสอบขึ้นมาและพบรีวิวปลอมต่อไปใครจะไว้วางใจในเว็บไซต์นี้อีก? อีกหนึ่งธุรกิจคือร้านค้าปลีกอย่าง Amazon ก็มีความเสี่ยงเช่นกัน แม้ว่า Zhao จะชี้ให้เห็นว่าสามารถตรวจสอบได้ จากข้อมูลการสั่งซื้อจริงของคนที่รีวิวก็ตาม


แต่นักวิจัยก็หาทางที่จะต่อสู้กับวิกฤติครั้งนี้ แม้ว่ารีวิวปลอมอาจมีลักษณะเหมือนจริงกับที่เขียนโดยมนุษย์ แต่ก็มีความแตกต่างที่ลึกซึ้งที่โปรแกรมคอมพิวเตอร์สามารถตรวจจับได้หากรู้ถึงกฎการกระจายตัวอักษร (a, b, c, d และอื่น ๆ )

รีวิวปลอมมาจากรีวิวจริงและมีข้อมูลบางส่วนหายไปในกระบวนการ รีวิวปลอมจะให้ความสำคัญกับความคล่องตัวและความน่าเชื่อถือ ดังนั้นอย่างน้อยเราจะสามารถสังเกตได้จากการใช้ภาษา นักวิจัยกล่าวว่า “การสูญเสียข้อมูลที่เกิดขึ้นระหว่างการฝึก AI จะแสดงออกมาในข้อความรีวิวที่ถูกเขียนออกมา ทำให้เกิดความแตกต่างในการใช้ภาษาที่สามารถสังเกตได้ ระหว่างข้อความที่ AI สร้างขึ้นและข้อความของมนุษย์”

Zhao กล่าวว่าหากต้องการแก้ไขข้อบกพร่องตรงนี้ก็สามารถทำได้ โดยการซื้อฮาร์ดแวร์คอมพิวเตอร์ราคาแพงและใช้มันเพื่อสร้างเครือข่ายประสาทที่มีความซับซ้อนมากขึ้นให้กับ AI ดังนั้นเราจึงไม่ควรนิ่งนอนใจในการป้องกันการคุกคามของรีวิวปลอมจาก AI นี้โดยเพิ่มการเฝ้าระวังให้มากขึ้น ทำให้ทุกอย่างมันยากสำหรับพวกเขามากที่สุดที่จะผ่านด่านการป้องกันไปได้

ดังนั้น เมื่อการป้องกันแน่นหนาขึ้น จะต้องใช้เงินเป็นจำนวนมากในการสร้าง AI มาเขียนรีวิวปลอม คนที่ชนะก็อาจเป็นคนที่มีเงินเยอะและไม่ยอมแพ้ง่ายๆ “นั่นคือการรักษาความปลอดภัยทั้งหมดที่เราจะทำได้ ทำให้พวกผู้ร้ายทำงานยากที่สุด แม้ว่าสุดท้ายแล้วเราอาจจะไม่สามารถหยุดการโจมตีอย่างแท้จริงของพวกผู้ร้ายมั่งคั่งได้ก็ตาม”

ในแถลงการณ์ทางอีเมลโฆษกของ Yelp Rachel Youngblade กล่าวว่า Yelp ให้ความสำคัญกับการศึกษาครั้งนี้ “เรายกย่องงานวิจัยนี้มาก และมองว่าเป็นความท้าทายครั้งใหญ่ของเว็บไซต์รีวิว เช่น Yelp ในการดูแลคอนเทนท์ของเรา เนื่องจากความพยายามที่จะพัฒนาระบบต่อไปเรื่อยๆ และมันมีความซับซ้อนมากขึ้น Yelp มีระบบในการป้องกันคอนเทนท์ของเรามานานกว่าสิบปี แต่นี่เป็นเหตุผลที่เรายังคงให้ความสำคัญกับระบบเหล่านั้น ไม่ใช่เพียงเพื่อตรวจสอบรีวิวปลอม แต่รวมไปถึงรีวิวลำเอียงและพวกรีวิวไม่มีประโยชน์อีกด้วย เราขอขอบคุณเจ้าของงานวิจัยนี้ที่เลือกใช้ระบบของ Yelp ในฐานะของข้อเท็จจริงพื้นฐานและยอมรับในความมีประสิทธิภาพของมัน


“ในขณะที่การศึกษานี้มุ่งเน้นเฉพาะในการสร้างรีวิวที่ดูเหมือนของจริง Yelp แนะนำให้ใช้ซอฟต์แวร์ที่มีวิธีวิเคราะห์คำแบบองค์รวมมากขึ้น โดยใช้ตัวบ่งชี้ที่มากขึ้นนอกเหนือจากเนื้อหาข้อความเพียงอย่างเดียวเพื่อพิจารณาแต่ละรีวิว และไม่สนับสนุนรีวิวที่อาจมาจากคนจริงแต่ไม่มีประโยชน์หรือมีอคติ “

รีวิวไม่ใช่ทุกสิ่งทุกอย่าง
รีวิวเป็นจุดเริ่มต้นที่เหมาะสำหรับนักวิจัยในการเริ่มทดสอบเทคโนโลยีการสังเคราะห์ข้อความ พวกเขามีจุดมุ่งหมายและทิศทางที่ชัดเจน มีหัวเรื่องที่ต้องการศึกษาที่แน่ชัด พวกเขาทำตามโครงสร้างที่ค่อนข้างมาตรฐานและใช้เวลาเพียงสั้นๆ เพราะหากยิ่งใช้เวลานาน ยิ่งเพิ่มโอกาสของความผิดพลาด Zhao กล่าว แต่ก็เชื่อได้ว่าพวกเขาจะไม่หยุดเพียงเท่านี้

“นี่เป็นภัยคุกคามที่กำลังใหญ่ขึ้นเรื่อยๆ และกระจายตัวไปในสังคมที่กลุ่มผู้ใช้มีขนาดใหญ่และไม่ค่อยสนใจอะไร และสั่นคลอนความเชื่อมั่นของเราในการตัดสินอะไรจริงอะไรไม่จริง ผมคิดว่าเราจะมีมาตรฐานใหม่ที่ดียิ่งขึ้น” Zhao กล่าว “ดังนั้นเราจึงเริ่มต้นด้วยการรีวิวทางออนไลน์

“มันเป็นไปได้ที่จะมีภัยร้ายออนไลน์ที่ใหญ่ขึ้น บทความทั้งหมดที่เขียนขึ้นในบล็อกอาจสร้างขึ้นโดยอัตโนมัติโดยหุ่นยนต์ตามธีมบางอย่างที่ถูกกำหนดขึ้น ทำให้หลังจากนี้คุณจะต้องคิดถึงแหล่งข้อมูลที่มาให้มากขึ้น และลองคิดต่อว่าเราจะตรวจสอบได้อย่างไรว่ามันเป็นของจริงรึเปล่า นี่คือสิ่งที่ผมคิดว่าเป็นความท้าทายที่ใหญ่กว่ามากสำหรับพวกเราทุกคนในอีกไม่กี่ปีข้างหน้า ผมอยากให้คนใส่ใจกับเรื่องนี้ให้มากขึ้นและมองว่ามันเป็นภัยคุกคามที่แท้จริง” เพื่อกระตุ้นให้ บริษัทต่างๆ เช่น Yelp และ Amazon เริ่มคิดเกี่ยวกับการป้องกันให้มากขึ้นหากยังไม่ได้ทำ

ศาสตราจารย์หวังว่า “เราเรียกให้เกิดความใส่ใจมากขึ้น ไม่เพียงแค่การออกแบบเทคโนโลยีเพื่อป้องกันเท่านั้น แต่หมายถึงช่วยกันใช้สายตาและจิตใจคอยเฝ้าระวังภัยจากการใช้เทคโนโลยีที่มันควรจะมีประโยชน์ ผมว่าคนจำนวนมากให้ความสำคัญกับ Singularity และ Skynet ในฐานะที่เป็นภัยคุกคามที่น่าจับตามากของ AI แต่ผมคิดว่ามีภัยคุกคามที่แท้จริงและส่งผลกระทบมากกว่านี้ที่มาจาก AI นี่เป็นเพียงส่วนเล็กๆ ของภูเขาน้ำแข็งที่ยังมีก้อนโตอยู่ใต้น้ำ”

เขาเสริมว่า “ผมอยากให้คนที่มีส่วนในการเฝ้าระวังความปลอดภัยมาร่วมกับผมและมองปัญหาเหล่านี้ เพื่อให้เราสามารถมีความหวังในการไล่ตามสิ่งเหล่านี้ให้ทัน เพราะการพัฒนาของ AI นั้นรวดเร็วและก้าวหน้าเสมอ ถ้าเราไม่เริ่มมองหาการป้องกันตอนนี้ เราอาจไม่มีวันตามทันอีกเลย”

ก่อนจบมีตัวอย่างรีวิว 6 ข้อมาให้ลองเล่นกัน คุณสามารถบอกได้หรือไม่ว่ารีวิวเหล่านี้อันไหนเป็นของจริง?
จำนวนหนึ่งของรีวิวพวกนี้ถูกสร้างขึ้นโดยเครือข่ายประสาทของนักวิจัยจากมหาวิทยาลัยชิคาโก ส่วนที่เหลือเป็นรีวิวจริง คุณบอกได้ไหมว่าอันไหนจริง อันไหนปลอม?

1. มันกลายมาเป็นร้านอาหารอิตาเลียนร้านโปรดของฉันอย่างง่ายดาย ฉันรักเมนูเรียกน้ำย่อย ทุกอย่างดีงามมาก ฉันขอแนะนำ carpaccio และหน่อไม้ฝรั่ง แต่น่าเศร้าที่มันได้กลายเป็นที่รู้จักกันอย่างแพร่หลายมากขึ้น ทำให้ยากที่จะจองโต๊ะในช่วงไพรม์ไทม์

2. ครอบครัวและฉันเป็นแฟนตัวยงของที่นี่ พนักงานน่ารักสุดๆ และอาหารก็ดีมาก ไก่ดีมากและซอสกระเทียมก็สมบูรณ์แบบ ไอศกรีมราดด้วยผลไม้ก็อร่อยมาก แนะนำสุดๆ

3. ฉันมาที่นี่ทุกปีในช่วงคริสต์มาสและฉันชอบพาสต้าจริงๆ! ดีคุ้มค่ากับราคา!

4. พิซซ่าเลิศ ลาซานญ่าและหอยเชลล์ก็ดีที่สุดที่ฉันเคยกิน ของหวานก็เยอะแยะและเยี่ยมยอด

5. อาหารที่นี่อเมซิ่งสุดๆ ไซส์ยักษ์ด้วย เบเกิลชีสปรุงสุกเพอร์เฟคมาก สดและอร่อย! บริการก็รวดเร็ว เป็นจุดโปรดของเราอย่างแน่นอน! เราจะกลับมา!

6. ฉันเป็นลูกค้ามาประมาณหนึ่งปีครึ่ง เลยไม่มีเรื่องอะไรที่จะพูดถึงที่นี่มากนัก ฉันมักจะได้รับพิซซ่า แต่เนื้อวัวอิตาเลียนก็ดี และฉันก็ประทับใจ บริการที่นี่ก็โดดเด่น เป็นบริการที่ดีที่สุดที่ฉันเคยได้รับ แนะนำมากๆ เลย

คำตอบ?
1 เป็นของจริง 2 เป็นของปลอม 3 และ 4 เป็นของจริงและ 5 และ 6 เป็นของปลอม

Source

แปลและเรียบเรียงโดย Prim NM