ค้นให้ลึก DeepSeek เอไอจีน จะก้าวไปไกลแค่ไหน

ในช่วงที่ไม่กี่ปีผ่านมาถือได้ว่าวงการปัญญาประดิษฐ์มีการเติบโตอย่างก้าวกระโดด เริ่มจาก OpenAI ที่ส่ง ChatGPT มาประเดิมในสนามที่ไม่เคยมีใครเอาโปรดักส์ของตัวเองลงมาเล่นในเชิงพาณิชย์มาก่อน ตามมาด้วย Google Gemini (ที่เดิมชื่อว่า Google Bard) จากค่าย Search Engine ยักษ์ใหญ่ระดับโลกอย่าง Google ที่หวังชิงส่วนแบ่งเค้กก้อนใหม่ที่ยังไม่มีใครมาแย่งชิงมากนัก

นับจาก 30 พฤศจิกายน 2022 ที่ CHatGPT เปิดตัวมีข่าวลือหนาหูมาตลอดว่านอกจากสหรัฐอเมริกาที่วางตัวเป็นพี่ใหญ่ในวงการเทคฯ และต่อเนื่องมายังโลกของการพัฒนา AI ก็ยังมีจีนที่มีนักวิจัยที่เก่งกาจไม่แพ้กัน แต่การที่จีนจะขึ้นมาทาบรัศมีของอเมริกาไม่ใช่เรื่องง่ายเพราะกุญแจสำคัญของการพัฒนา AI คือ การเทรนโมเดลให้ฉลาดและสามารถโต้ตอบกับมนุษย์ได้อย่างเป็นธรรมชาติไร้ที่ติ แต่การทำแบบนั้นได้ต้องอาศัยพลังการประมวลผลจากหน่วยประมวลผลสำคัญคือ GPU ซึ่งตอนนี้ก็เห็นจะเป็นใครไปไม่ได้นอกจาก Nvidia และ AMD ซึ่งครองส่วนแบ่งตลาดรวมกันเกิน 90% และนี่คือที่มาว่าทำไมค่ายผู้พัฒนา AI จากจีนเราแทบไม่ได้ยินข่าวพวกเขาเลย

แต่มาในวันนี้วันที่บทความนี้เผยแพร่ออกไปข่าวคราวการมาถึงของ Deepseek AI สัญชาติจีนแท้ขึ้นมาปรากฏอยู่ในแทบทุกนิวส์ฟีด สำนักข่าวทั่วโลกต่างพร้อมใจกันเล่นข่าวนี้ชนิดที่ไม่ต่างจากตอนที่ ChatGPT เปิดตัว

แน่นอนว่าถ้าเป็นแค่บริษัทสตาร์ทอัป AI ธรรมดา ๆ ไม่น่าทำให้หุ้นเทคที่เกี่ยวข้องกับ AI ของสหรัฐฯ ร่วงแรงขนาดนี้ อะไรทำให้ Deepseek ได้รับการจับตามองมากขนาดนี้ มากขนาดที่ว่าใครบางคนบอกว่า Deepseek จะก้าวขึ้นมาท้าทายเจ้าตลาดอย่าง ChatGPT ได้เลย

เราจะพาคุณไปทำความรู้จักกับ Deepseek อย่างลึกซึ้ง ตั้งแต่จุดเริ่มต้น วิสัยทัศน์ เทคโนโลยีที่พวกเขาพัฒนา ไปจนถึงผลกระทบที่มีต่อวงการ AI โลก และอนาคตที่น่าจับตามองของบริษัทสตาร์ตอัปจากแดนมังกรแห่งนี้เป็นเรื่องที่น่าจับตามองเป็นอย่างยิ่ง

Deepseek คืออะไร

DeepSeek เป็นบริษัทสตาร์ตอัปด้าน AI ของจีน ก่อตั้งขึ้นโดย เหลียง เหวินเฟิง (Liang Wenfeng) นักธุรกิจชาวจีนวัย 40 ปีจากมณฑลกวางตุ้ง เหลียงเติบโตมาในยุคที่จีนกำลังเร่งพัฒนาเทคโนโลยีเพื่อแข่งขันกับตะวันตก เขาศึกษาในมณฑลเจ้อเจียง ซึ่งเป็นศูนย์กลางด้านนวัตกรรมของจีน และเป็นบ้านเกิดของบริษัทระดับโลกอย่าง Alibaba

โฉมหน้าของ Liang Wenfeng ผู้ก่อตั้ง Deepseek: The Syndney Morning Herald

ก่อนที่จะเข้าสู่วงการ AI เหลียงเป็นผู้ร่วมก่อตั้ง High-Flyer กองทุนเฮดจ์ฟันด์ที่ใช้ AI ในการวิเคราะห์และซื้อขายหลักทรัพย์ High-Flyer มีสินทรัพย์ภายใต้การบริหารมากถึง 8 พันล้านดอลลาร์ ความสำเร็จของ High-Flyer เป็นหลักฐานที่แสดงให้เห็นถึง พลังของ AI ในภาคการเงิน และนี่เป็นจุดเริ่มต้นที่ทำให้เหลียงตัดสินใจก้าวเข้าสู่วงการ AI เต็มตัว

เมื่อก่อตั้ง DeepSeek ขึ้นในปี 2023 เขาไม่ได้ต้องการสร้างบริษัท AI ที่มุ่งเน้นเชิงพาณิชย์เท่านั้น แต่ต้องการ ปฏิวัติวงการปัญญาประดิษฐ์ของจีน DeepSeek มุ่งมั่นที่จะพัฒนา Artificial General Intelligence (AGI) หรือ ปัญญาประดิษฐ์ที่สามารถคิด วิเคราะห์ และเรียนรู้ได้อย่างมนุษย์ ซึ่งเป็นเป้าหมายที่ยิ่งใหญ่ของวงการ AI ทั่วโลก

DeepSeek ได้กลายเป็นชื่อที่สร้างแรงสั่นสะเทือนในวงการปัญญาประดิษฐ์ระดับโลกในช่วงเวลาแค่ไม่ถึง 2 ปีดี บริษัท AI สัญชาติจีนแห่งนี้สามารถ ท้าทายอำนาจของยักษ์ใหญ่ด้าน AI จากตะวันตก อย่าง OpenAI และ Google ได้อย่างไม่น่าเชื่อ แม้ว่าจะเป็นบริษัทที่เพิ่งก่อตั้งขึ้นในปี 2023 แต่ DeepSeek ก็ได้รับการยอมรับในฐานะหนึ่งในผู้เล่นที่สำคัญในยุทธศาสตร์ของจีน ที่ต้องการเป็น ผู้นำด้าน AI ภายในปี 2030

DeepSeek ขึ้นชื่อในด้านความสามารถขั้นสูงในการ ประมวลผลภาษาธรรมชาติ (Natural Language Processing: NLP) ซึ่งมีความโดดเด่นในงานต่าง ๆ เช่น การสรุปข้อความ การดึงข้อมูล และการสร้างข้อความที่เหมือนมนุษย์ตอบ ความสามารถเหล่านี้ทำให้ DeepSeek เป็นเครื่องมือที่ทรงคุณค่าสำหรับแอปพลิเคชันที่ต้องใช้ความเข้าใจและการโต้ตอบภาษาที่ซับซ้อน

นอกเหนือจาก NLP แล้ว DeepSeek ยังใช้ประโยชน์จาก Deep Learning Model เพื่อวิเคราะห์ชุดข้อมูลที่ซับซ้อน โดยให้ข้อมูลเชิงลึกและการคาดการณ์ที่มีค่าในอุตสาหกรรมต่าง ๆ ซึ่งรวมถึงการเงิน การดูแลสุขภาพ และการค้าปลีก ซึ่งการวิเคราะห์ข้อมูลที่แม่นยำมีความสำคัญอย่างยิ่งต่อการตัดสินใจ

ในด้านสถาปัตยกรรมการออกแบบระบบของ DeepSeek ยังได้รับการปรับให้เหมาะสมสำหรับ การประมวลผลแบบเรียลไทม์และการเพิ่มขนาดการประมวลผล (Real-time processing and scalability) ทำให้เหมาะสำหรับแอปพลิเคชัน เช่น การตรวจจับการฉ้อโกงและการกำหนดราคาแบบไดนามิก สามารถปรับขนาดได้อย่างราบรื่นเพื่อจัดการชุดข้อมูลขนาดใหญ่โดยไม่กระทบต่อประสิทธิภาพ ซึ่งเป็นสิ่งสำคัญสำหรับการวิเคราะห์ข้อมูลแบบเรียลไทม์

นอกจากนี้ DeepSeek ยังมีความสามารถในการเรียนรู้แบบหลายโหมด (Multimodal learning) หรือก็คือที่ AI สามารถประมวลผลและบูรณาการข้อมูลจากหลายแหล่งได้ ไม่ว่าจะเป็นข้อความ รูปภาพ และเสียง ซึ่งความได้เปรียบนี้ทำให้ Deepseek สามารถวิเคราะห์ข้อมูลแบบองค์รวมนี้ทำให้เหมาะอย่างยิ่งสำหรับแอปพลิเคชันที่ต้องการข้อมูลเชิงลึกที่ครอบคลุม

โฉมหน้าของ Deepseek Generative AI ตัวใหม่แปะยี่ห้อ Made in China: Deepseek

จุดแข็งที่ทำให้ DeepSeek แตกต่างจากคู่แข่ง

คุณสมบัติเด่นอย่างหนึ่งของ DeepSeek คือการที่พวกเขาสามารถควบคุมต้นทุนในการพัฒนา AI ได้ต่ำกว่าผู้เล่นเบอร์ใหญ่ของโลกหลายเท่าเล่นกับต้นทุน โดยสามารถทีมพัฒนา Deepseek พัฒนาโมเดลปัญญาประดิษฐ์ด้วยต้นทุนที่ต่ำกว่าอย่างมากเมื่อเทียบกับโมเดลที่คล้ายกันจากบริษัท AI ในสหรัฐฯ ยกตัวอย่างเช่น โมเดลตัวทอปของ Deepseek อย่าง Deepseek V3 ได้รับการพัฒนาด้วยงบประมาณต่ำกว่า 6 ล้านดอลลาร์ ในขณะที่ ChatGPT 4o ใช้งบประมาณในการพัฒนาอยู่ที่ประมาณ175 ล้านดอลลาร์ ซึ่งต่างกันมากถึงเกือบ 30 เท่าตัว

ราคาค่าบริการในการเชื่อมต่อ API ของ Deepseek เมื่อเทียบกับ OpenAI เรียกได้ว่าถูกกว่าหลายเท่าตัว: Deepseek

โดยที่มาของการควบคุมต้นทุนของ Deepseek นั้นมาจากการใช้ทรัพยากรอย่างมีประสิทธิภาพเป็นหลัก โดยค่าใช้จ่าย 6 ล้านดอลลาร์ครอบคลุมค่าใช้จ่ายในการฝึกอบรม DeepSeek-V3 ซึ่งรวมถึงการใช้ GPU NVIDIA H800 ซึ่งแม้จะไม่ทันสมัยเท่ารุ่น H100 รุ่นล่าสุด

แต่ DeepSeek ก็มีจำหน่ายเนื่องจากมีข้อจำกัดด้านการส่งออก ด้วยการใช้ประโยชน์จาก GPU เหล่านี้ DeepSeek จึงสามารถรักษาต้นทุนให้ต่ำได้ในขณะที่ยังคงให้ประสิทธิภาพที่สามารถแข่งขันได้

เมื่อเปรียบเทียบกันแล้ว บริษัท AI ของตะวันตก เช่น OpenAI และ Anthropic ลงทุนหลายพันล้านดอลลาร์ในการพัฒนาและบำรุงรักษาโมเดล AI ของตน ตัวอย่างเช่น ChatGPT ของ OpenAI คาดว่าจะมีค่าใช้จ่ายมากกว่าโมเดลของ DeepSeek อย่างมาก ซึ่งแสดงให้เห็นถึงความแตกต่างของต้นทุนระหว่างบริษัทเหล่านี้ ความสามารถของ DeepSeek ที่จะบรรลุประสิทธิภาพที่ใกล้เคียงกันด้วยทรัพยากรที่น้อยกว่าเป็นเครื่องพิสูจน์ถึงแนวทางเชิงกลยุทธ์ในการพัฒนา AI

นอกจากนี้ การใช้กลยุทธ์แบบโอเพนซอร์สของ DeepSeek ยังมีส่วนสำคัญในการควบคุมด้านความคุ้มทุนอีกด้วย

โดยปกติแล้วการเทรนด์โมเดลต่าง ๆ ของ AI จำเป็นจะต้องใช้ข้อมูลมหาศาล ตามมาด้วย GPU ที่ประมวลผลได้แรง ๆ และก็ค่าไฟอีกเยอะแยะมากมายจึงจะทำให้ AI นั่นฉลาดสุด ๆ แต่ที่ Deepseek ทีมวิศวกรของพวกเขาใช้วิธีเทรนด์โมเดลด้วยการทำให้โมเดลต่าง ๆ พร้อมใช้งานและปรับเปลี่ยนได้สาธารณะ DeepSeek จึงส่งเสริมสภาพแวดล้อมการทำงานร่วมกัน อันเป็นการลดต้นทุนการพัฒนาและเร่งนวัตกรรมไปในตัว ซึ่งแนวทางนี้ช่วยให้นักวิจัยและนักพัฒนาทั่วโลกสามารถมีส่วนร่วมและปรับปรุงโมเดลของ DeepSeek ได้ และเพิ่มขีดความสามารถของพวกเขาโดยไม่ต้องเสียค่าใช้จ่ายเพิ่มเติม

ยิ่งไปกว่านั้น DeepSeek ยังรู้จักที่จะรีดเร้นประสิทธิภาพของฮาร์ดแวร์ได้อย่างเต็มความสามารถหรือที่ภาษานักพัฒนาเรียกว่าการ Optimization โดยปรับกระบวนการฝึกอบรม AI ให้เหมาะสมโดยใช้ GPU ของ NVIDIA ได้อย่างมีประสิทธิภาพมากกว่าคู่แข่งหลายราย ซึ่งสามารถใช้งาน GPU ได้อย่างมีประสิทธิภาพสูงโดยใช้ทรัพยากรน้อยกว่า การใช้ฮาร์ดแวร์เชิงกลยุทธ์นี้ได้รับการยอมรับว่าช่วยเพิ่มประสิทธิภาพในการฝึกอบรมโมเดล AI

NVIDIA กับการพัฒนา AI ของ DeepSeek

GPU ของ NVIDIA ถือได้ว่าเป็นกระดูกสันหลังของการเทรนด์โมเดล AI ของบริษัทชั้นนำของโลก เนื่องจากมีประสิทธิภาพสูงและมีสถาปัตยกรรมเฉพาะทางที่ถูกออกแบบมาเพื่อการเทรน AI โดยเฉพาะ และ DeepSeek ก็เป็นอีกหนึ่งที่เช่นเดียวกับบริษัท AI หลายแห่งที่เลือกใช้ GPU ของ NVIDIA ในการเทรนโมเดลภาษาขนาดใหญ่

อย่างไรก็ตาม สิ่งที่ทำให้ DeepSeek แตกต่างคือความสามารถในการปรับ GPU เหล่านี้ให้เหมาะสมเกินกว่าแนวทางปฏิบัติมาตรฐาน ทำให้มีประสิทธิภาพและคุ้มต้นทุนอย่างน่าทึ่ง

ในช่วงแรก DeepSeek พึ่งพา GPU A100 ของ NVIDIA เป็นหลัก โดยพวกเขาซื้อตุนไว้เป็นจำนวนมากก่อนที่สหรัฐฯ ห้ามส่งออกไปจีน โดย DeepSeek อ้างว่าได้ใช้คลัสเตอร์ GPU NVIDIA H800 จำนวน 2,048 ตัวในการฝึกโมเดล V3 คลัสเตอร์นี้ประกอบด้วยโหนดเซิร์ฟเวอร์ 256 โหนด ซึ่งแต่ละโหนดติดตั้งตัวเร่งความเร็ว GPU H800 จำนวน 8 ตัว

Nvidia H100 ที่ Deepseek ใช้เทรนด์ Deepseek v3: Reuters

อย่างไรก็ตาม มีการคาดเดาและรายงานที่ขัดแย้งกันเกี่ยวกับจำนวน GPU จริงที่ DeepSeek ใช้ โดยแหล่งข่าวบางแหล่งระบุว่า Deepseek อาจมี GPU H100 ในครอบครองมากถึง 50,000 ตัวหากไม่ถูกจำกัดโดยข้อจำกัดการส่งออกของสหรัฐฯ แม้จะมีการอ้างสิทธิ์เหล่านี้ DeepSeek ก็ได้ออกมาให้ข่าวว่าพวกเขามี GPU ในครอบครองไม่กี่พันตัวเท่านั้นเนื่องจากถูกห้ามส่งออกชิป

DeepSeek ได้พัฒนาอย่างก้าวกระโดดด้วยการใช้การเขียนโปรแกรมแบบ PTX (Parallel Thread Execution) ที่คล้ายกับภาษา Assembly* (ภาษาโปรแกรมมิ่งภาษาหนึ่งที่มีความใกล้เคียงกับภาษาเครื่อง [Machine Code] ) แทน CUDA ทำให้ได้ประสิทธิภาพในการประมวลผลที่รวดเร็ว

*Assembly Language หรือ ภาษาแอสเซมบลี เป็น ภาษาคอมพิวเตอร์ระดับต่ำ (Low-Level Programming Language) ที่ใช้ในการเขียนโปรแกรมสำหรับ สถาปัตยกรรมของหน่วยประมวลผล (CPU Architecture) โดยตรง ภาษา Assembly ถูกใช้เพื่อ ควบคุมฮาร์ดแวร์โดยละเอียด และเป็นภาษาที่ใกล้เคียงกับ ภาษาเครื่อง (Machine Language) มากที่สุด

มาตรฐาน PTX ช่วยให้พวกเขาสามารถ Optimize (ปรับแต่ง) โมเดลได้อย่างละเอียด เช่น การจัดสรรรีจิสเตอร์และการปรับระดับเธรด/วาร์ป ซึ่งไม่สามารถทำได้ด้วยภาษา CUDA C/C++ แนวทางนี้ทำให้ DeepSeek สามารถฝึกโมเดลภาษา Mixture-of-Experts (MoE) ด้วยพารามิเตอร์ 671 พันล้านตัวโดยใช้คลัสเตอร์ GPU NVIDIA H800 จำนวน 2,048 ตัวในเวลาเพียงสองเดือน ทำให้มีประสิทธิภาพสูงกว่าผู้นำในอุตสาหกรรมอย่าง Meta ถึง 10 เท่า

ในการเทรนโมเดล V3 DeepSeek วิศวกรของ Deepseek ได้กำหนดค่า GPU H800 ของ NVIDIA ใหม่ทั้งหมดโดยจัดสรรมัลติโพรเซสเซอร์สตรีมมิ่ง 20 ตัวจากทั้งหมด 132 ตัวสำหรับการสื่อสารระหว่างเซิร์ฟเวอร์ การปรับแต่งแบบนี้ช่วยให้พวกเขาเอาชนะข้อจำกัดด้านการเชื่อมต่อและเพิ่มความเร็วของธุรกรรมข้อมูล นอกจากนี้ DeepSeek ยังนำ Algorithm Pipeline ขั้นสูงมาใช้ ซึ่งช่วยเพิ่มประสิทธิภาพการทำงานเพิ่มเติมด้วยการปรับระดับเธรด/การบิดอย่างละเอียด

DeepSeek จะมาดิสรัปต์อุตสาหกรรม AI โลก?

ความสำเร็จของ DeepSeek ได้จุดประเด็นคำถามสำคัญเกี่ยวกับแนวทางการพัฒนา AI ทั้งของ Silicon Valley และรัฐบาลสหรัฐฯ โดยที่ผ่านมา บริษัทเทคของสหรัฐฯ ถูกมองว่ามีความได้เปรียบในด้านการพัฒนา AI อย่างมาก เนื่องจากเป็นบริษัทขนาดใหญ่ที่สามารถดึงดูดผู้มีความสามารถจากทั่วโลก และมีเงินทุนมหาศาลในการสร้างศูนย์ข้อมูลและซื้อชิปประสิทธิภาพสูงราคาแพงเพื่อนำมาเทรนด์โมเดล AI ให้ทำงานได้อย่างฉลาดและแม่นยำ

แต่การมาของ DeepSeek ได้ท้าทายความเชื่อที่ว่า ใครก็ตามที่อยากจะพัฒนาเทคโนโลยี AI จะต้องใช้เงินหลายพันล้านดอลลาร์จึงจะก้าวขึ้นมาเป็นผู้นำด้าน AI ได้

Adam Kobeissi ผู้ก่อตั้งจดหมายข่าววิเคราะห์การตลาด The Kobeissi Letter ได้โพสต์ในแพลตฟอร์ม X ว่า “OpenAI ก่อตั้งมา 10 ปี มีพนักงาน 4,500 คน และระดมทุนไปแล้ว 6.6 พันล้านดอลลาร์ ในขณะที่ DeepSeek เพิ่งก่อตั้งไม่ถึง 2 ปี มีพนักงานแค่ 200 คน และใช้เงินพัฒนาน้อยกว่า 10 ล้านดอลลาร์ แล้วทำไมทั้งสองบริษัทถึงมาเป็นคู่แข่งกันได้?”

ทีมวิศวกรของ DeepSeek เปิดเผยงานในวิจัยว่าพวกเขาใช้ชิป Nvidia H800 ประมาณ 2,000 ตัว ซึ่งมีประสิทธิภาพด้อยกว่าชิปรุ่นล่าสุด โดยทีมได้ใช้โมเดลเฉพาะทางหลายตัวทำงานร่วมกันเพื่อให้ชิปที่ช้ากว่าสามารถวิเคราะห์ข้อมูลได้อย่างมีประสิทธิภาพมากขึ้น

สำหรับรัฐบาลสหรัฐฯ การเติบโตของ DeepSeek ได้จุดประเด็นคำถามเกี่ยวกับกลยุทธ์การควบคุมความก้าวหน้าด้าน AI ของจีนผ่านการจำกัดการส่งออกชิปประสิทธิภาพสูง งานวิจัยของ DeepSeek ชี้ให้เห็นว่า อาจไม่จำเป็นต้องใช้ชิปที่ทันสมัยที่สุดในการสร้างโมเดล AI ที่มีประสิทธิภาพสูง หรือบริษัทจีนยังสามารถหาซื้อชิปได้ในปริมาณที่เพียงพอ หรืออาจเป็นทั้งสองกรณี

ชิป H800 ของ Nvidia ถูกออกแบบมาให้สอดคล้องกับมาตรการควบคุมการส่งออกของสหรัฐฯ สามารถส่งออกไปจีนได้อย่างเสรีจนถึงเดือนตุลาคม 2023 เมื่อรัฐบาลของประธานาธิบดีไบเดนเพิ่มชิปเหล่านี้เข้าไปในรายการสินค้าควบคุม

ในการให้สัมภาษณ์กับ Waves ในปี 2023 เลียงเปิดเผยว่าบริษัทของเขาได้กักตุน GPU* Nvidia A100 ไว้ถึง 10,000 ตัวก่อนที่จะถูกสั่งห้ามส่งออก

GPU (Graphics Processing Units) คือวงจรอิเล็กทรอนิกส์ที่ใช้เร่งความเร็วในการประมวลผลกราฟิกและภาพในอุปกรณ์คอมพิวเตอร์

DeepSeek อาจเป็นศัตรูหมายเลข 1 ที่แท้จริงของบรรดา ยักษ์ใหญ่ AI ระดับโลก อย่าง OpenAI, Google (DeepMind), Microsoft และ Anthropic ซึ่งครองตลาด AI อยู่ในขณะนี้ แม้ว่าจะเป็นสตาร์ตอัปหน้าใหม่จากจีน แต่มีก็หลายปัจจัยที่ทำให้เชื่อได้ว่า DeepSeek จะขึ้นมาท้าทายอำนาจของบริษัทเทคฯ ของสหรัฐฯ ได้

DeepSeek ใช้ต้นทุนต่ำกว่าคู่แข่งมหาศาล

นี่เป็นหนึ่งในข้อได้เปรียบที่สุดของ DeepSeek คือ ต้นทุนการพัฒนาโมเดล AI ที่ต่ำกว่าอย่างมาก เมื่อเทียบกับบริษัท AI ของสหรัฐฯ ยกตัวอย่าง

OpenAI ใช้เงินทุนมหาศาลในการพัฒนา ChatGPT (ประมาณ 100 ล้านดอลลาร์ขึ้นไปสำหรับแต่ละเวอร์ชัน)
Google และ Anthropic ลงทุนใน AI เป็นพันล้านดอลลาร์โดยใช้ชิปประสิทธิภาพสูงอย่าง NVIDIA H100

ในขณะที่ DeepSeek พัฒนาโมเดล DeepSeek-R1 ได้ในงบเพียง 5.6 ล้านดอลลาร์ ซึ่งเป็นตัวเลขที่น้อยกว่าหลายเท่า เหตุก็เพราะ DeepSeek ประสบความสำเร็จในการลดต้นทุน โดยใช้ ชิป AI รุ่นเก่าของ NVIDIA (A100) และโครงสร้างพื้นฐานที่ประหยัดต้นทุน แทนการใช้ชิปรุ่นใหม่ที่แพงกว่าหลายเท่า แล้วไป Optimize การเทรนด์โมเดล แทนที่จะไปทุ่มให้กับ Hardware แพง ๆ เหมือนอย่างที่บริษัทเทคในสหรัฐฯ ทำกัน

ความหมายของเรื่องนี้ก็คือ DeepSeek สามารถสร้างโมเดล AI ที่มีคุณภาพสูงใน ราคาที่ต่ำกว่า เจ้าอื่น ๆ ในท้องตลาดได้ ซึ่งอาจส่งผลทำให้บริษัทเทคฯ และองค์กรขนาดเล็กสามารถเข้าถึง AI ได้โดยไม่ต้องลงทุนมหาศาล

ลดการผูกขาด AI จากบริษัทสหรัฐฯ ที่กำลังครองตลาดอยู่ในปัจจุบัน นั่นหมายถึงว่า กำไรของบริษัทเทคสหรัฐฯ อาจลดลงได้อย่างมีนัยสำคัญ

DeepSeek-R1 อาจเทียบชั้นหรือเหนือกว่า ChatGPT

DeepSeek ได้เปิดตัว DeepSeek-R1 ซึ่งมีการรายงานว่ามี ประสิทธิภาพเทียบเท่าหรือเหนือกว่า ChatGPT และ AI รุ่นอื่น ๆ ที่ใช้ต้นทุนพัฒนาสูงกว่าอย่างมาก ChatGPT (GPT-4) เป็นหนึ่งใน AI ที่ล้ำหน้าที่สุด แต่ใช้ทรัพยากรและต้นทุนสูงมาก ในขณะที่ DeepSeek-R1 สามารถแข่งขันได้โดยใช้ทรัพยากรที่จำกัดกว่า และใช้ต้นทุนที่ต่ำกว่า แต่ก็ได้ประสิทธิภาพที่ใกล้เคียงกัน เรื่องนี้แสดงให้เห็นว่า การใช้เงินมหาศาลไม่ได้แปลว่าจะสร้าง AI ที่ดีที่สุดเสมอไป

ความหมายของเรื่องนี้ก็คือ ถ้า DeepSeek สามารถแข่งขันกับ ChatGPT ได้จริง OpenAI อาจเสียความได้เปรียบด้านเทคโนโลยีทำให้บริษัทอื่น ๆ สามารถพัฒนา AI ที่มีประสิทธิภาพใกล้เคียงกันโดยไม่ต้องใช้เงินมากถึงระดับพันล้านดอลลาร์

ผลกระทบต่อตลาด AI และความตื่นตัวของนักลงทุน

หลังจากที่ DeepSeek เปิดตัวโมเดลของตนเอง มูลค่าหุ้นของ Nvidia และ Alphabet (Google) ลดลง เนื่องจากนักลงทุนเริ่มกังวลว่า ต้นทุนที่ต่ำของ DeepSeek อาจเปลี่ยนโฉมการแข่งขันในตลาด AI เพราะในเมื่อการจะเทรนโมเดลให้เก่งกาจอาจไม่จำเป็นต้องใช้ GPU แรง ๆ เสมอไปและใช้มันสมองและสองมือของวิศวกรในการ Optimize โค้ดของระบบให้สามารถรีดประสิทธิภาพ GPU ที่มีอยู่ก็เพียงพอแล้ว

เรื่องนี้ทำให้ Nvidia สูญเสียมูลค่าตลาดไปกว่า 600,000 ล้านดอลลาร์ หลังจากข่าวของ DeepSeek แพร่สะพัด ความหมายของเรื่องนี้ก็คือนักลงทุนเริ่มรับรู้ว่า DeepSeek เป็นคู่แข่งที่มีศักยภาพสูง และอาจเป็นปัจจัยเปลี่ยนแปลงตลาด AI

นอกจากนี้ บริษัท AI อื่น ๆ อาจต้องลดราคาบริการ AI ของตนลงเพื่อรักษาส่วนแบ่งตลาดนั่นทำให้ราคาหุ้นของบริษัทที่เกี่ยวข้องกับ AI ลดลง

DeepSeek กำลังท้าทายข้อจำกัดทางเทคโนโลยีของสหรัฐฯ

DeepSeek เป็นอีกหนึ่งเครื่องพิสูจน์ว่า ข้อจำกัดการส่งออกเทคโนโลยี AI ของสหรัฐฯ อาจไม่ได้หยุดจีนจากการพัฒนา AI ได้จริง ทั้งนี้ก็เพราะว่า สหรัฐฯ พยายามจำกัดการส่งออกชิป AI ขั้นสูงของ Nvidia (เช่น H100) ไปยังจีน (ตั้งแต่ยุค โจ ไบเดน) เพื่อหยุดยั้งความก้าวหน้าทางเทคโนโลยี (โดยเฉพาะ AI ของจีน) ทางอ้อม

แต่ทว่า DeepSeek ก็ยังเอาตัวรอดได้โดยการใช้ชิปรุ่นเก่ากว่า แต่ยังคงสร้างโมเดล AI ที่แข็งแกร่งได้นี่จึงทำให้เกิดคำถามว่า นโยบายจำกัดการเข้าถึงเทคโนโลยีของสหรัฐฯ จะยังได้ผลอยู่อีกหรือไม่

ความหมายของเรื่องนี้ก็คือ DeepSeek อาจเป็นแรงผลักดันให้จีนเร่งพัฒนาอุตสาหกรรมชิปของตัวเอง และถ้าจีนสามารถพัฒนา AI โดยไม่ต้องพึ่งพาชิปจากตะวันตก การแข่งขัน AI ระหว่างจีนกับสหรัฐฯ จะรุนแรงขึ้น

DeepSeek กำลังเปลี่ยนแปลงตลาด AI อย่างมีนัยสำคัญ หากบริษัทสามารถขยายเทคโนโลยีของตนได้ OpenAI, Google, และ Microsoft อาจต้องเผชิญกับการแข่งขันที่ไม่เคยมีมาก่อน

DeepSeek กำลังกลายเป็นหนึ่งในบริษัท AI ที่สร้างแรงสั่นสะเทือนไปทั่วอุตสาหกรรมเทคโนโลยีระดับโลก ด้วยความสามารถในการพัฒนาโมเดล AI ที่มีประสิทธิภาพสูงในต้นทุนต่ำ ซึ่งเป็นปัจจัยสำคัญที่อาจเปลี่ยนโฉมการแข่งขันในตลาด AI ที่ปัจจุบันถูกครอบครองโดยบริษัทตะวันตกอย่าง OpenAI, Google, Microsoft และ Anthropic

หนึ่งในจุดแข็งของ DeepSeek คือ การพัฒนาโมเดล AI ตัวทอป (DeepSeek-R1 ) ในงบประมาณที่ต่ำกว่าการพัฒนาโมเดลของคู่แข่งจากสหรัฐฯ อย่างมหาศาล แสดงให้เห็นว่าการสร้าง AI ที่ทรงพลังไม่ได้จำเป็นต้องใช้เงินลงทุนระดับพันล้านดอลลาร์เสมอไป โดย DeepSeek สามารถ ลดต้นทุนการฝึกโมเดล AI ได้อย่างมีประสิทธิภาพ ผ่านการใช้ ชิป NVIDIA A100 รุ่นเก่า แทนชิปรุ่นใหม่ที่มีราคาแพงกว่า

ผลกระทบของ DeepSeek ไม่ได้จำกัดอยู่เพียงแค่ด้านเทคโนโลยี แต่ยังสั่นสะเทือนไปถึงตลาดการเงินและการลงทุน โดยหลังจากที่ DeepSeek เปิดตัว AI ของตนเอง มูลค่าหุ้นของ Nvidia และ Alphabet (Google) ลดลงอย่างมีนัยสำคัญ เนื่องจากนักลงทุนเริ่มตระหนักว่า ต้นทุนที่ต่ำของ DeepSeek อาจเปลี่ยนโฉมการแข่งขันในอุตสาหกรรม AI

นอกจากผลกระทบด้านเศรษฐกิจ DeepSeek ยังมีนัยทางภูมิรัฐศาสตร์ ที่สำคัญ เพราะ Deepseek พิสูจน์ให้เห็นว่า มาตรการจำกัดการส่งออกเทคโนโลยี AI ของสหรัฐฯ อาจไม่สามารถหยุดการพัฒนา AI ของจีนได้ DeepSeek สามารถพัฒนาโมเดล AI ที่มีประสิทธิภาพสูงโดยใช้ ทรัพยากรที่จีนสามารถเข้าถึงได้เอง ซึ่งอาจกระตุ้นให้จีนเร่งพัฒนา อุตสาหกรรมชิป AI ภายในประเทศ เพื่อลดการพึ่งพาเทคโนโลยีจากตะวันตก

อีกหนึ่งผลกระทบที่สำคัญคือ การเปิดโอกาสให้บริษัทขนาดเล็กและสตาร์ตอัปสามารถเข้าสู่ตลาด AI ได้ง่ายขึ้น เดิมที AI เป็นเทคโนโลยีที่ถูกครอบครองโดยบริษัทใหญ่ที่มีทรัพยากรจำนวนมหาศาล แต่ DeepSeek แสดงให้เห็นว่า บริษัทที่มีงบประมาณจำกัดก็สามารถพัฒนาโมเดลที่แข่งขันกับยักษ์ใหญ่ในอุตสาหกรรมได้ หากสามารถออกแบบให้ มีประสิทธิภาพสูงโดยใช้ทรัพยากรที่จำกัด

เราจึงอาจพูดได้ว่า DeepSeek ไม่ใช่แค่ สตาร์ตอัป AI ทั่วไป แต่กำลังกลายเป็นอีกหนึ่งผู้เล่นที่เข้ามาเปลี่ยนแปลงการแข่งขันของอุตสาหกรรม AI ทั้งในด้านต้นทุนการพัฒนา AI, การกระจายโอกาสให้บริษัทเล็ก ๆ และผลกระทบต่อความสมดุลทางภูมิรัฐศาสตร์ ในอนาคต หาก DeepSeek สามารถรักษาข้อได้เปรียบเหล่านี้ไว้ได้ บริษัทเทคโนโลยีตะวันตกอย่าง OpenAI, Google และ Microsoft อาจต้องเผชิญกับการแข่งขันที่หนักหน่วงกว่าที่เคยเป็นมา

เรื่อง: ณัฐศกรณ์ แสงลับ

อ้างอิง

https://www.economist.com/leaders/2025/01/29/the-real-meaning-of-the-deepseek-drama

https://www.economist.com/business/2025/01/28/nvidia-is-in-danger-of-losing-its-monopoly-like-margins

https://www.economist.com/business/2025/01/27/deepseek-sends-a-shockwave-through-markets

https://apnews.com/article/deepseek-ai-china-f4908eaca221d601e31e7e3368778030

https://time.com/7210521/deepseek-chinese-ai-models/

https://www.nytimes.com/2025/01/27/technology/what-is-deepseek-china-ai.html

https://edition.cnn.com/2025/01/27/tech/deepseek-stocks-ai-china/index.html

https://www.bbc.com/news/articles/c5yv5976z9po

https://www.aljazeera.com/economy/2025/1/28/why-chinas-ai-startup-deepseek-is-sending-shockwaves-through-global-tech

https://www.forbes.com/sites/tylerroush/2025/01/28/who-is-behind-deepseek-heres-what-to-know-about-founder-liang-wenfeng/