μλΉλμ GTC 2026: λ©λͺ¨λ¦¬ λ³λͺ© ν΄κ²°κ³Ό μΆλ‘ μ λλ³ν, λΉμ₯ μ£Όλͺ©ν΄μΌ ν 3 κ°μ§ ν΅μ¬
μλΉλμ μ μ¨ ν©μ΄ λ°νν 2026 λ GTC ν€λ ΈνΈλ λ¨μν μ μ ν λ°νλ₯Ό λμ΄ AI μΈνλΌμ ꡬ쑰μ ν¨λ¬λ€μμ μμ ν λ€μ§κ³ μμ΅λλ€. νΉν 'μΆλ‘ (Inference)' λ¨κ³μμ λ©λͺ¨λ¦¬ λ³λͺ©μ ν΄κ²°νκΈ° μν΄ Groq μ LPU λ₯Ό μλΉλμ μν€ν μ²μ 곡μ νΈμ μν¨ μ μ μ κ³ μ 체μ κ΄μ¬μ μ§μ€μν€κ³ μμ£ . κΈ°μ‘΄ GPU κ° HBM μ ν΅ν΄ λμ©λ λ°μ΄ν°λ₯Ό μ²λ¦¬νλ λ°©μκ³Ό λ¬λ¦¬, SRAM κΈ°λ°μ μ΄μ μ§μ° νλ‘μΈμκ° FFN μ°μ°μ μ λ΄νλ μλ‘μ΄ νμ΄λΈλ¦¬λ μμ€ν μ΄ λ±μ₯νμ΅λλ€.
ν΅μ¬μ LP30 LPU μ Rubin NVL72 μ μν λΆλ΄μΌλ‘, Decode λ¨κ³μ λ³λͺ© ꡬκ°μ μλ²½ν ν΄κ²°ν μ μ λλ€. LPX λ μμ€ν μ 256 κ°μ LP30 μΉ©μ νμ¬ν΄ μ΄ 128GB μ SRAM μ μ 곡νλ©°, λμνμ΄ λ¬΄λ € 640TB/s μ λ¬ν΄ κΈ°μ‘΄ HBM λλΉ μλμ μΈ μ²λ¦¬ μλλ₯Ό 보μ¬μ€λλ€. μ΄λ‘ μΈν΄ λ¨μΌ Rubin NVL72 λ λλΉ μ΅λ 2 λ°° μμ€μ λμ μμνμ μ°½μΆν μ μμΌλ©°, 2026 λ νλ°κΈ° μΆμλ₯Ό μλκ³ μμ΅λλ€.
3D μ μΈ΅κ³Ό CPO νλλ‘ κ°λ μλΉλμμ 1 μ‘° λ¬λ¬ λ‘λλ§΅
λμ± λλΌμ΄ κ²μ 2028 λ μΆμ μμ μΈ 'Feynman' νλ«νΌμμ 3D Die Stacking κΈ°μ μ΄ λ‘μ§ λ€μ΄μλ μ μ©λ κ²μ΄λΌλ μ μ λλ€. μ΄λ λ°μ΄ κ΄λ¦¬λΌλ λμ λ₯Ό 극볡ν κ²½μ°, λμΌ λ©΄μ λ΄μμ μ°μ° μμμ κ·Ήλννκ³ μ λ ₯ ν¨μ¨μ νκΈ°μ μΌλ‘ κ°μ νλ ꡬ쑰μ λ³νλ₯Ό μλ―Έν©λλ€. λν NVLink Switch μ CPO(κ΄μ°κ²°) κ° μ€μΌμΌμ μμκΉμ§ νλ μ μ©λλ©°, κΈ°μ‘΄ ꡬ리 μΌμ΄λΈκ³Όμ 곡쑴μ ν΅ν΄ κ΄ν΅μ μμ₯μ΄ κΈκ²©ν μ±μ₯ν μ λ§μ λλ€. μ μ¨ ν©μ 2027 λ κΉμ§ Blackwell κ³Ό Rubin νλ«νΌμ λμ λ§€μΆμ΄ 1 μ‘° λ¬λ¬μ λ¬ν κ²μ΄λΌκ³ μ μΈνλ©°, μ΄ μ°μ μ΄ μμ§ λ°μλμ§ μμ κ±°λν μ±μ₯ 곑μ μ 보μ¬μ£Όκ³ μμ΅λλ€.
Feynman νλ«νΌμ 3D Die Stacking κΈ°μ μ΄ μ€μ μμ° λ¨κ³μμ μ΄ κ΄λ¦¬μ μμ¨ λ¬Έμ λ₯Ό κ²ͺμ΄ μΆμκ° μ§μ°λ κ²½μ°, κ΄λ ¨ μ£Όκ°μ λ³λμ±μ΄ μ»€μ§ μ μμ΅λλ€. λν CPO κΈ°μ μ΄ κ΅¬λ¦¬ μΌμ΄λΈμ μμ ν λ체νκΈ°λ³΄λ€ μ μ§μ μΌλ‘ νλλλ μλκ° μμ₯ κΈ°λμΉλ³΄λ€ λ릴 κ²½μ°, λ¨κΈ°μ μΈ λ§€μΆ μ±μ₯μΈκ° λνλ μ μμ΅λλ€.
μλΉλμμ μλ‘μ΄ μν€ν μ²λ λ©λͺ¨λ¦¬ λ³λͺ©μ ν΄κ²°νκ³ μΆλ‘ μ±λ₯μ κ·Ήλννλ ꡬ쑰μ μ νμ μ΄λ©°, μ΄μ λ°λ₯Έ νμ΄λ리μ κ΄μ°κ²° λΆνμ¬λ€μ μ±μ₯μ μ΄μ μμμ λΆκ³Όν©λλ€.