คุณเคยคิดในใจไหมว่า เจ้าของเสียงพูดที่คุณได้ยินจะมีลักษณะใบหน้าเป็นเช่นใด หากคุณไม่เคยเห็นหน้าบุคคลนั้นมาก่อน มาบัดนี้ AI สามารถทำแบบนี้ได้แล้ว

ทีมนักวิทยาศาสตร์ได้พัฒน AI ชื่อ ” Speech2Face” ขึ้นมาโดยสอนมันให้วิเคราะห์คลิปวิดีโอนับล้านคลิปในอินเตอร์เน็ต ซึ่งแสดงลักษณะใบหน้าพร้อมน้ำเสียงและวิธีพูดของบุคคลจำนวนกว่า 100,000 ราย

AI ตัวนี้ทำงานคล้ายเครือข่ายเส้นประสาทในสมองมนุษย์ มันจะจดจำและสามารถจินตนาการใบหน้าของเสียงพุดลึกลับได้ไม่ต่างจากมนุษย์ แต่ที่แน่นอนกว่าคือผลงานของมันออกมาใกล้เคียงความจริงกว่ามนุษย์มากพอดู (ลองดูภาพด้านบน)

“เวลานี้ AI ของเราทำได้เพียงการจินตนาการใบหน้าแบบไม่เจาะจงเป๊ะๆ ใบหน้าที่มันนึกออกมานั้นเป็นเพียงใบหน้าทั่วไปที่เข้าข่ายว่าจะลงตัวกับน้ำเสียงและวิธีการพูดแบบนั้น”

“ที่มันทำได้ค่อนข้างแม่นยำ คือการคาดเดาช่วงอายุ เพศ และเชื้อชาติของเจ้าของเสียงพูดลึกลับนั้น”

“แต่เรายังต้องปรับปรุงมันอีกมาก ข้อบกพร่องแรกที่มีตอนนี้คือมันจะสับสนเชื้อชาติกับภาษา ยกตัวอย่างเช่นหากให้ผู้ชายชาวเอเชียพูดจีนให้มันฟัง มันจะคาดเดาใบหน้าของผู้พุดได้ใกล้เคียงมาก แต่หากให้ผู้ชายคนเดิมพูดอังกฤษ มันจะคาดเดาใบหน้าออกมาเป็นฝรั่ง”

“ข้อบกพร่องต่อมาคือมันจะสับสนผู้หญิงเสียงใหญ่กับผู้ชายเสียงเล็ก ผลการคาดเดาจะออกมาสลับเพศ”

แน่นอนว่าทีมงานยังคงพัฒนา AI ตัวนี้ต่อไปอย่างขะมักเขม้น เผื่อว่าสักวันหนึ่งความสามารถในทางนี้ของมันจะสามารถนำมาต่อยอดในการช่วยเหลืองานต่างๆของสังคมมนุษย์ได้

งานวิจัยนี้ลงตีพิมพ์เผยแพร่ลงในวารสาร  arXiv  ฉบับวันที่ 23 พ.ค.62

เรียบเรียงโดย @MrVop