ซูเปอร์คอมพิวเตอร์ LineShine ของจีนครองอันดับหนึ่ง TOP500 ด้วยความเร็ว 2.2 ExaFLOPS แบบ CPU‑only

ที่มาภาพ: Tom's Hardware

Hardware-อ่าน 7 นาทีTom's Hardware

ซูเปอร์คอมพิวเตอร์ LineShine ของจีนครองอันดับหนึ่ง TOP500 ด้วยความเร็ว 2.2 ExaFLOPS แบบ CPU‑only

⚡ สรุป 30 วิ

LineShine ของจีนทำ 2.198 FP64 ExaFLOPS ด้วย CPU‑only เป็นเครื่องแรกใน TOP500 ที่ทะลุ 2 ExaFLOPS…

LineShine ซุปเปอร์คอมพิวเตอร์ของจีนขึ้นแท่น 1‑อันดับของรายการ TOP500 หลังจากทำคะแนน 2.198 FP64 ExaFLOPS ในเบนช์มาร์ค Linpack โดยใช้เพียง CPU เท่านั้น การบรรลุผลระดับนี้เป็นครั้งแรกในประวัติศาสตร์ของ TOP500 และชี้ให้เห็นถึงความก้าวหน้าของเทคโนโลยีเซมิคัสตอมจีนในสาขาคอมพิวเตอร์ความเร็วสูง

Overview

ซุปเปอร์คอมพิวเตอร์ LineShine ถูกติดตั้งที่ศูนย์คอมพิวเตอร์ความเร็วสูงแห่งชาติในเซินเจิ้น (NSCS) และผลการทดสอบถูกส่งเข้าสู่รายการ TOP500 โดยศูนย์คอมพิวเตอร์เมฆของเซินเจิ้น (Shenzhen Cloud Computing Center) รายละเอียดของระบบระบุว่าเป็นเครื่องที่ใช้ CPU เท่านั้นโดยไม่มีการเสริมด้วยตัวเร่งความเร็ว (accelerator) ใด ๆ การได้คะแนน 2.198 FP64 ExaFLOPS ทำให้เครื่องนี้กลายเป็นเครื่องแรกที่ทำลายเกณฑ์ “เหนือ 2 ExaFLOPS double‑precision” ด้วยสถาปัตยกรรม CPU

จากมุมมองของอุตสาหกรรม HPC การที่จีนสามารถสร้างเครื่องที่ทำงานได้เร็วขนาดนี้โดยพึ่งพาเทคโนโลยีภายในประเทศ ถือเป็นสัญญาณสำคัญต่อการลดการพึ่งพาเทคโนโลยีจากต่างประเทศ โดยเฉพาะอย่างยิ่งในช่วงที่ข้อจำกัดด้านการส่งออกของสหรัฐฯ กำลังเข้มงวดขึ้น

Technical Details

เครื่อง LineShine ประกอบด้วย CPU รุ่น LX2 ที่ออกแบบโดยใช้สถาปัตยกรรม Armv9 พร้อมคำสั่ง SVE (Scalable Vector Extension) และ SME (Scalable Matrix Extension) รายละเอียดหลักของระบบมีดังนี้

  • CPU: 304‑core LX2, 1.55 GHz, จัดเป็น 8‑cluster แต่ละ cluster มี 38 core
  • จำนวน Core ทั้งหมด: 13.79 ล้าน core
  • หน่วยความจำ: 32 GB HBM บนแพ็กเกจ (แบนด์วิธสูงสุด 4 TB/s) + สูงสุด 256 GB DDR5 ภายนอก
  • อินเทอร์คอนเนค: ระบบเชื่อมต่อภายใน LingQi ของจีน
  • การใช้พลังงาน: 42.2 MW ทั้งระบบ

สถาปัตยกรรมหน่วยความจำแบบผสมระหว่าง HBM และ DDR5 มีจุดมุ่งหมายเพื่อเพิ่มแบนด์วิธและความจุพร้อมกัน แม้ว่าอัตราการเร่งจาก FP64 ไปยัง mixed‑precision จะเพิ่มเพียง 3.6 เท่า ซึ่งน้อยกว่าที่เห็นในระบบที่ใช้ตัวเร่งความเร็วเช่น AMD Instinct MI300A หรือ Intel Ponte Vecchio

Performance Metrics

ในเชิงประสิทธิภาพ LineShine ทำคะแนน 2.198 FP64 ExaFLOPS ในการทดสอบ Linpack และให้ 52.07 GFLOPS/W จากการคำนวณพลังงาน ซึ่งต่ำกว่า El Capitan ที่ได้ 60.94 GFLOPS/W อย่างไรก็ตาม มันยังเหนือกว่า Fugaku ของญี่ปุ่นซึ่งให้ค่า 14.78‑16.84 GFLOPS/W ทั้งในโหมดที่ปรับประสิทธิภาพและไม่ปรับ

นอกจากการทดสอบ Linpack แล้ว LineShine ยังทำคะแนน 22.00 HPCG‑PFLOPS ทำให้ขึ้นเป็นอันดับหนึ่งในตาราง HPCG อีกด้วย อย่างไรก็ตาม เมื่อวัดในโหมด mixed‑precision ผ่าน HPL‑MxP เครื่องนี้ได้ 7.92 EFLOPS ซึ่งยังตามไม่ทัน El Capitan, Frontier และ Aurora ทำให้ศักยภาพในการฝึกและสรุปโมเดล AI ยังอยู่ในระดับที่ต้องพัฒนาเพิ่มเติม

Comparison

การเปรียบเทียบระหว่างซุปเปอร์คอมพิวเตอร์ระดับโลกหลายเครื่องแสดงให้เห็นถึงความแตกต่างของแนวทางออกแบบ

  • LineShine ใช้ CPU‑only โดยอาศัย Armv9 + SVE/SME เพื่อเร่งงานเวกเตอร์และเมทริกซ์
  • Frontier และ Aurora ใช้ GPU หรือ Xe‑HPC accelerator ที่ให้การเร่ง mixed‑precision สูงกว่า 10‑15 เท่า
  • Fugaku แม้จะเป็น CPU‑only แต่ใช้สถาปัตยกรรม ARM‑based รุ่นเก่าและให้ประสิทธิภาพต่อวัตต์ต่ำกว่าอย่างมีนัยสำคัญ

ผลลัพธ์นี้สรุปได้ว่า LineShine มีความแข็งแกร่งในงานคำนวณ double‑precision (FP64) แต่ยังขาดความได้เปรียบในงานที่ต้องการความเร็วแบบ low‑precision เช่น การฝึก AI ซึ่งมักพึ่งพา accelerator พิเศษ

Analysis

จากข้อมูลที่เปิดเผย การออกแบบ LX2 เน้นการรวม SVE และ SME เข้ากับหน่วยความจำ HBM ทำให้เครื่องสามารถทำงานด้านวิทยาศาสตร์คอมพิวเตอร์ที่ต้องการความแม่นยำสูงได้ดี การใช้ CPU‑only ยังช่วยลดความซับซ้อนของซอฟต์แวร์และการจัดการระบบ อย่างไรก็ตาม ความก้าวหน้าในด้าน mixed‑precision ยังถูกจำกัดโดยแบนด์วิธของหน่วยความจำและประสิทธิภาพของ LingQi interconnect ซึ่งยังไม่เทียบเท่ากับ InfiniBand หรือ NVLink ที่ใช้ในระบบอื่น

แม้ว่าการเพิ่มประสิทธิภาพจาก FP64 ไปยัง FP16/BF16 จะอยู่ที่ระดับ 3.6 เท่า ซึ่งอาจดูต่ำ แต่เป็นผลมาจากการที่ระบบยังไม่มีตัวเร่งความเร็วแยกส่วนและซอฟต์แวร์ที่สนับสนุนการทำงานแบบ mixed‑precision ยังอยู่ในขั้นตอนพัฒนา การประเมินผลในระยะยาวจึงต้องพิจารณาถึงการอัพเกรดฮาร์ดแวร์และการเพิ่มประสิทธิภาพของซอฟต์แวร์ต่อไป

Impact

การที่ LineShine ได้รับตำแหน่ง 1‑อันดับใน TOP500 ด้วยสถาปัตยกรรม CPU‑only ของจีน แสดงให้เห็นว่าประเทศจีนมีศักยภาพในการพัฒนาเทคโนโลยีคอมพิวเตอร์ความเร็วสูงที่อิสระจากอุปกรณ์ของสหรัฐฯ หรือญี่ปุ่น นี้อาจส่งผลต่อการแข่งขันด้าน HPC ระหว่างประเทศและอาจกระตุ้นให้ผู้ผลิตอื่น ๆ พิจารณานำ Armv9 เข้าไปใช้ในระบบ HPC ของตน

สำหรับอุตสาหกรรม AI แม้ว่า LineShine ยังตามไม่ทันในด้าน mixed‑precision แต่การมีเครื่องที่ทำงาน FP64 ได้เร็วกว่า 2 ExaFLOPS อย่างต่อเนื่อง จะช่วยสนับสนุนงานวิจัยด้านฟิสิกส์, ด้านเคมี, และการจำลองสภาพอากาศระดับโลก ซึ่งต้องการความแม่นยำสูง

Summary

LineShine ของจีนครองตำแหน่ง 1‑อันดับใน TOP500 ด้วยคะแนน 2.198 FP64 ExaFLOPS ใช้ CPU‑only บนสถาปัตยกรรม Armv9 การบรรลุนี้แสดงให้เห็นถึงความก้าวหน้าในด้านคอมพิวเตอร์ความเร็วสูงของจีน แม้ความสามารถในงาน mixed‑precision ยังคงต้องพัฒนาเพิ่มเติมก็ตาม.

แชร์บทความนี้:

ชอบบทความแบบนี้?

สมัคร AI Automate Weekly Newsletter — รับเคล็ดลับ AI + how-to ใหม่
ทุกสัปดาห์ตรงถึง inbox ฟรี ไม่มีสแปม

แหล่งข่าวต้นฉบับ

ชื่อต้นฉบับ
China's LineShine supercomputer dethrones US' El Capitan, secures first place in Top 500 list — first machine in the rankings to sustain more than 2 ExaFLOPS of double-precision performance using only CPUs
ผู้เขียน
Anton Shilov
แหล่ง
Tom's Hardware
วันที่เผยแพร่
23 มิถุนายน 2569 เวลา 19:55

Related

บทความที่เกี่ยวข้อง

Cornelis Network นำ Omni‑Path มาใช้แทน InfiniBand ในคลัสเตอร์ Lynx ของ DOEHardware
19 มิถุนายน 2569 เวลา 03:00

Cornelis Network นำ Omni‑Path มาใช้แทน InfiniBand ในคลัสเตอร์ Lynx ของ DOE

DOE เลือกสวิตช์และ NIC Omni‑Path CN5000 ของ Cornelis Network เป็นโครงข่ายหลักของคลัสเตอร์ Lynx 952 โหนด ทำให้สเกลได้ 91 % ที่ 400 Gbps แสดงตลาด HPC…

The Register7 นาที
Intel Diamond Rapids เปิดตัว 192 คอร์ใหม่ ยกเลิก Hyper‑th…Hardware
1 มิถุนายน 2569 เวลา 12:00

Intel Diamond Rapids เปิดตัว 192 คอร์ใหม่ ยกเลิก Hyper‑th…

Intel เปิดตัว Diamond Rapids รุ่น Xeon ที่เพิ่มคอร์สูงสุดเป็น 192 คอร์ แต่ยกเลิก Hyper‑threading ทำให้จำนวนเธรดลดเหลือ 192 เธรด…

The Register7 นาที
นักวิจัย UNSW พัฒนาวิธีทำเอสเปรสโซด้วยคลื่นอัลตราโซนิกที่อุณหภูมิห้องHardware
23 มิถุนายน 2569 เวลา 17:00

นักวิจัย UNSW พัฒนาวิธีทำเอสเปรสโซด้วยคลื่นอัลตราโซนิกที่อุณหภูมิห้อง

นักวิจัย UNSW พัฒนา “ultrasonic espresso” ทำกาแฟที่อุณหภูมิห้องภายใน 3 นาทีโดยใช้คลื่นอัลตราโซนิก…

TechSpot7 นาที
เกมเมอร์ไทยเลือกอุปกรณ์เล่นเกมระหว่างสมาร์ทโฟน แท็บเล็ต พีซี หรือคอนโซลHardware
23 มิถุนายน 2569 เวลา 09:30

เกมเมอร์ไทยเลือกอุปกรณ์เล่นเกมระหว่างสมาร์ทโฟน แท็บเล็ต พีซี หรือคอนโซล

การสำรวจของ GSM Arena พบว่าเกมเมอร์ไทยนิยมเล่นเกมบนสมาร์ทโฟนเป็นหลัก แม้ว่าตลาดเกมกำลังเผชิญแรงกดดันจาก COVID‑19 การขุดคริปโตและความต้องการ RAM สำหรับ AI…

GSMArena7 นาที
คัดลอกลิงก์แล้ว!