ในเดือนมกราคมปีนี้ บริษัทเริ่มต้นด้านความฉลาดประดิษฐ์ DeepSeek ได้ปล่อยผลงานสองครั้ง ผ่านรุ่นใหม่ R1 ของมัน ซึ่งได้กําหนดใหม่เศรษฐกิจของความฉลาดประดิษฐ์อย่างเงียบสงบรูปแบบนี้มีประสิทธิภาพสูงสุด ในราคา 1/40 ของรุ่นก่อนหน้าณ เดือนธันวาคม 2024 รูปแบบภาษาใหญ่ V3 ของ DeepSeek ได้ลดค่าฝึกอบรมลงกว่า 90%
สองสิ่งที่ดีปซิกค้นพบ ได้ดึงดูดความสนใจทั่วไปDeepSeek เปิดเผยว่าการขอให้รุ่น AI อธิบายถึงกระบวนการคิดของพวกเขา - แนวทางการวิจัยที่รู้จักกันในชื่อ chain-of-thought prompting - ได้ปรับปรุงความแม่นยําและประสิทธิภาพอย่างที่สอง DeepSeek ใช้ปัญญาประดิษฐ์เพื่อสร้างข้อมูลของตัวเอง โดยอิสระจากการติดป้ายข้อมูลด้วยมือขณะที่มีข้อโต้แย้งว่า DeepSeek ไม่ถูกเท่าที่มันอ้าง, ความก้าวหน้าเหล่านี้ ได้นําไปสู่ยุคใหม่ของเศรษฐกิจ AI อย่างแน่นอน
โครงสร้างค่าใช้จ่ายของปัญญาประดิษฐ์กําลังเปลี่ยนแปลงอย่างมหัศจรรย์ แต่ละดอลลาร์ของการเพิ่มผลงานและการลงทุนในพื้นฐานการเปลี่ยนแปลงนี้อาจทําให้แรงตลาดพลิกพลิก และในที่สุดช่วยให้บริษัทใหม่ที่เคลื่อนไหวได้ทันกับยักษ์เทคโนโลยีในระยะสั้นในขณะที่เพิ่มอัตรากําไร
พวกยักษ์ใหญ่ทางเทคโนโลยีได้ลงทุนกว่า 100 พันล้านดอลลาร์ ในการพัฒนาพื้นฐาน AI และมันยังคงเพิ่มขึ้นตอนนี้พวกเขาต้องพิจารณาวิธีการสร้างผลตอบแทน จากการลงทุนขนาดใหญ่เหล่านี้ และรักษาความดีต่ออัลการิทึม, ผู้แข่งขันในตลาดที่เล็กกว่า. ในสถานการณ์ที่เปลี่ยนแปลงอย่างรวดเร็ว ทั้งยักษ์เทคโนโลยีและบริษัทใหม่ ๆ กําลังเผชิญหน้ากับสัญญาณที่ชัดเจน:หรือถูกกําจัด.
สถานการณ์ตลาด AI ก่อนและหลัง DeepSeek
ก่อนการก้าวขึ้นของ DeepSeek บริษัทใหม่ๆ พยายามที่จะแข่งขันกับการใช้จ่ายในพื้นฐานของพวกยักษ์เทคโนโลยีซึ่งทุ่มเงินเป็นพันล้านดอลลาร์ เพื่อสร้างศูนย์ข้อมูลขนาดใหญ่ทุกไตรมาส และได้ประโยชน์จากความก้าวหน้าในเทคโนโลยีปัญญาประดิษฐ์พวกยักษ์ใหญ่เหล่านี้ไม่เพียงแต่มีทรัพยากรข้อมูลที่มหาศาล แต่ยังรวบรวมความสามารถของปริญญาเอกจํานวนมาก และความก้าวหน้าของอัลกอริทึมยังขึ้นอยู่กับความแข็งแกร่งทางเทคนิคของพวกเขาเครือข่ายจําหน่ายที่มีมานานทําให้พวกเขาสามารถขนส่งสินค้าให้กับลูกค้าที่มีอยู่อย่างรวดเร็ว และเร่งความก้าวหน้าทางเทคโนโลยีผ่านวงจรการตอบสนอง.
แต่ปัจจุบันนี้ สตาร์ทอัพใหญ่พอที่จะแข่งขันกับยักษ์ใหญ่ด้านเทคโนโลยี โดยปี 2025 เท่านั้น ค่าต้นแบบการฝึกหัดจะลดลงถึง 95%การลดลดข้อดีด้านพื้นฐานของผู้ใหญ่ด้านเทคโนโลยีค่าใช้จ่ายในการอ้างอิงได้ลดลงเกือบพันเท่าในช่วงสามปีที่ผ่านมา และคาดว่าจะลดลงต่อไปในอนาคตระยะเวลาของข้อดีทางอัลการิธม์ถูกลดลงเป็น 45-100 วัน และอาจลดลงต่อไป.
เมื่อต้นทุนการฝึกอบรมไม่ได้เป็นข้อขัดขวางหลักแล้ว การผลิตผลการสรุป (นั่นคือการผลิตแบบ AI ได้ดีแค่ไหนในแอปพลิเคชั่นในเวลาจริง) จะกลายเป็นจุดมุ่งหมายใหม่รุ่นราคาถูกกว่า ที่มีพลังงานเทียบเท่ารุ่นใหญ่ และสามารถทํางานได้กับ Gpus ที่มีประสิทธิภาพต่ํากว่าหากผลิตภัณฑ์ AI ที่ฉลาดกว่าสามารถนําเสนอได้ในราคาที่ต่ํามาก แล้วบริษัทใหม่ ๆ ในที่สุดจะมีโอกาสได้ผลงานดีกว่ายักษ์ใหญ่ของเทคโนโลยีในขณะที่เพิ่มกําไร
การจัดสรรแรงงานที่มีประสิทธิภาพเพิ่มเติมผลประโยชน์ของผู้ท้าทาย ด้วยการไม่จําเป็นต้องจ้างคนงานระดับปริญญาเอกจํานวนมากเพื่อประกอบทีม AI ที่มีความสามารถในการแข่งขันปรับปรุงและเนื่องจากพวกเขามักจะเน้นในระดับการใช้งานผู้ท้าทายสามารถเพลิดเพลินกับอัตรากําไรที่สูงขึ้น ในแบบเดียวกันกับการเริ่มต้นของเมฆได้ประโยชน์จากการปรับปรุงเศรษฐกิจของหน่วย 15 ปีที่ผ่านมา.
แนวโน้มนี้ไม่เพียงแค่ดีสําหรับการเริ่มต้น แต่ยังทําให้บริษัทเช่น Nvidia มีความเสี่ยงมากขึ้น หลังจากการประกาศของ DeepSeek ราคาหุ้นของ Nvidia ลดลง 12% แม้ว่ามันจะฟื้นฟูขึ้นความเสี่ยงสําหรับผู้ผลิตชิปเพิ่มขึ้นเพราะความต้องการกําลังเปลี่ยนจากเครื่องจักรที่เน้นการฝึกอบรมไปยังการแก้ไขการสรุปที่มีประสิทธิภาพมากขึ้นการเพิ่มขึ้นของหน่วยประมวลผลประสาทระดับผู้บริโภค (Npus) อาจเร่งการเปลี่ยนแปลงนี้ โดยอนุญาตให้รุ่น AI สามารถทํางานเป็นพื้นเมืองบนอุปกรณ์ เช่น สมาร์ทโฟนและคอมพิวเตอร์นับถือ
การใช้จ่ายด้านปัญญาประดิษฐ์
สิ่งที่ดีสําหรับผู้ท้าทาย ก็ไม่ดีสําหรับยักษ์เทคโนโลยีมหาอํานาจ AI ได้เชื่อมโยงการก้าวหน้าของ DeepSeek กับความสําคัญของความมั่นคงแห่งชาติ โดยพยายามที่จะสร้างความสนับสนุนโดยไม่สนใจความจริงที่ว่า นักวิจัยสหรัฐอเมริกา รวมถึงที่มหาวิทยาลัยสแตนฟอร์ดบริษัทที่ลงทุนเงินจํานวนมากในโครงการพื้นฐานข้อมูล อาจถาม: การใช้จ่ายจํานวนมากในการวิจัยและพัฒนารุ่น AI เป็นการสูญเสียหรือไม่? ถ้าเทคโนโลยีราคาถูกทํางานได้ดีเหมือนเทคโนโลยีแพง ทําไมต้องใช้เงินมากขนาดนี้?
แนวโน้มทางประวัติศาสตร์ชี้ให้เห็นว่า ความก้าวหน้าของ AI ส่วนใหญ่นั้น ได้พึ่งพาการลงทุนทุนในขนาดมากเกินไปกว่าสิ่งที่ถือว่าเป็นอัลกอริทึมที่ดีที่สุดในเวลานั้นความก้าวหน้าทางเทคโนโลยีใหม่ๆ พิสูจน์ว่า เราสามารถทําผลงานได้เท่ากัน ด้วยค่าใช้จ่ายที่ต่ํากว่า แม้ว่าการแก้ไขที่ประสิทธิภาพสูง เช่น DeepSeek จะได้ปรับปรุงประสิทธิภาพสูงขึ้นการขยายตัวของผู้ให้บริการเมฆขนาดใหญ่ยังคงต้องการศูนย์ข้อมูลขนาดใหญ่และต้องรับค่าใช้จ่ายการสรุปที่เพิ่มขึ้น.
อย่างไรก็ตาม พวกยักษ์ใหญ่ของเทคโนโลยีไม่ได้นั่งเฉยๆ เรากําลังเห็นการแข่งขันอาวุธสําหรับความสําเร็จของ DeepSeekAzure AI Foundry ของไมโครซอฟท์ และ LLaMA แหล่งเปิดของเมต้า ทั้งหมดกําลังแข่งขันเพื่ออํานาจ. โมเดลแหล่งเปิดสามารถมีบทบาทสําคัญ มาร์ค ซัคเกอร์เบิร์ก กรรมการผู้จัดการใหญ่ของ Meta เน้นความสําคัญของ AI ที่เป็นบุคคลบุคคล - นั่นคือ โมเดลที่ปรับปรุงตามความต้องการ วัฒนธรรมและความชอบของผู้ใช้แต่ละคน.วิสัยทัศน์นี้ตรงกับแนวโน้มที่กว้างกว่าในการพัฒนา AI: รูปแบบขนาดเล็กและเฉพาะเจาะจงมากขึ้น ที่สามารถให้ผลงานสูง โดยไม่ต้องใช้พื้นฐานเมฆขนาดใหญ่
สตาร์ทอัพชนะชิปใหม่
ในขณะเดียวกัน มหาเศรษฐีแหล่งเปิดและมหาเศรษฐีแหล่งปิดมีเป้าหมายที่แตกต่างกัน ทําให้ผู้ท้าทายมีข้อดีมากขึ้นโมเดลแหล่งเปิดที่สร้างขึ้นโดยบริษัทเช่น Meta จะยังคงแข่งขันและลดต้นทุนในระบบนิเวศ, ขณะที่รุ่นแหล่งปิดพยายามเรียกค่าธรรมเนียมสูงขึ้นผ่านเทคโนโลยีที่ดีกว่า. การเริ่มต้นสามารถนําผลประโยชน์จากการแข่งขันระหว่างสองค่ายเพื่อบรรลุอัตราส่วนราคา / ผลงานที่ดีที่สุดสําหรับการใช้งานแต่ละครั้งขณะที่เพิ่มอัตรากําไร.
ไม่ว่าจะเป็นขนาดของธุรกิจ ข้อความชัดเจน: ใช้ประโยชน์จากข้อดีเฉพาะ ๆ ที่มีให้กับพวกเขา - ความเคลื่อนไหวของตลาด, พลังคอมพิวเตอร์และความสามารถ - อย่างรวดเร็วหรือเผชิญกับความล้มเหลววงจรของความก้าวหน้าทางเทคโนโลยีจะสั้นลงจากเดือนหรือแม้แต่ปีที่ใช้ในการตั้งมาตรฐานการทํางานใหม่ ถึงความก้าวหน้าทางเทคโนโลยีของ DeepSeek ที่ชี้ให้เห็นว่ามันสามารถใช้เวลาเพียง 41 วันนวัตกรรมกําลังก้าวหน้าในอัตราที่ไม่เคยมีมาก่อนและพื้นที่ความอดทนความผิดพลาดกําลังลดลงอย่างรวดเร็ว