๐Ÿญ ์‚ฐ์—…์œ ์ง„ํˆฌ์ž์ฆ๊ถŒ

GPU ๋…์ฃผ ๋๋‚ฌ๋‹ค, ์„ธ๋ ˆ๋ธŒ๋ผ์Šค์™€ AWS์˜ '์ถ”๋ก  ๋ถ„๋ฆฌ'๊ฐ€ ๋ฉ”๋ชจ๋ฆฌ ์‹œ์žฅ์„ ๋’คํ”๋“ ๋‹ค

๐Ÿ”์ด ์‚ฐ์—…, ์™œ ์ง€๊ธˆ ์ฃผ๋ชฉํ•ด์•ผ ํ•˜๋‚˜?

์ง€๊ธˆ ๋ฐ˜๋„์ฒด ์‹œ์žฅ, ํŠนํžˆ ๋ฉ”๋ชจ๋ฆฌ ์„นํ„ฐ๋Š” ๋‹จ์ˆœํ•œ ๊ฐ€๊ฒฉ ์ƒ์Šน์„ ๋„˜์–ด ์•„ํ‚คํ…์ฒ˜์˜ ๋Œ€์ „ํ™˜๊ธฐ์— ์„œ ์žˆ์Šต๋‹ˆ๋‹ค. ์ตœ๊ทผ ์˜คํ”ˆAI ์™€ 750MW ๊ณต๊ธ‰ ๊ณ„์•ฝ์„ ๋งบ์€ ์„ธ๋ ˆ๋ธŒ๋ผ์Šค๊ฐ€ AWS ์™€๋„ ํ˜‘๋ ฅํ•˜๋ฉฐ 'Wafer Scale Engine(WSE)' ๊ธฐ์ˆ ์„ ๋„์ž…ํ•˜๋ฉด์„œ ์‚ฐ์—… ํŒ๋„๊ฐ€ ๋ฐ”๋€Œ๊ณ  ์žˆ์ฃ . ๊ธฐ์กด GPU ๋Œ€๋น„ ๋‹ค์ด ํฌ๊ธฐ๊ฐ€ ์ˆ˜์‹ญ ๋ฐฐ๋‚˜ ๊ฑฐ๋Œ€ํ•˜๋ฉด์„œ๋„, ๋น„ํ™œ์„ฑํ™” ๊ฐ€๋Šฅํ•œ ๋”๋ฏธ ์ฝ”์–ด๋ฅผ ๋ฏธ๋ฆฌ ์„ค๊ณ„ํ•ด ์ˆ˜์œจ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๋ฐฉ์‹์ด ์ฃผ๋ชฉ๋ฐ›๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋‹จ์ˆœํžˆ ์นฉ ํ•˜๋‚˜๊ฐ€ ์ปค์ง€๋Š” ๊ฒƒ์„ ๋„˜์–ด, AI ์ถ”๋ก  (Inference) ์˜ ํŒจ๋Ÿฌ๋‹ค์ž„์„ ๊ทผ๋ณธ์ ์œผ๋กœ ๋ฐ”๊พธ๋Š” ์‹ ํ˜ธ์ž…๋‹ˆ๋‹ค.

๐Ÿ“Š๋ฌด์Šจ ์ผ์ด ๋ฒŒ์–ด์ง€๊ณ  ์žˆ๋‚˜?

ํ•ต์‹ฌ์€ AWS ๊ฐ€ ์—”๋น„๋””์•„์™€ ์œ ์‚ฌํ•œ '์ถ”๋ก  ๋ถ„๋ฆฌ (Inference Disaggregation)' ์•„ํ‚คํ…์ฒ˜๋ฅผ ์ฑ„ํƒํ–ˆ๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค. AWS ๋Š” Prefill ๋‹จ๊ณ„๋ฅผ ์ž์‚ฌ Trainium ์ด ๋‹ด๋‹นํ•˜๊ณ , ์„ธ๋ ˆ๋ธŒ๋ผ์Šค์˜ CS-3 ๊ฐ€์†๊ธฐ๊ฐ€ Decode ๋‹จ๊ณ„ ์—ฐ์‚ฐ์„ ์ „๋‹ดํ•˜๋Š” ๊ตฌ์กฐ๋กœ ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋กœ ์ธํ•ด DRAM ๊ณผ NAND ๊ฐ€๊ฒฉ๋„ ๋šœ๋ ทํ•œ ์ƒ์Šน์„ธ๋ฅผ ๋ณด์ด๊ณ  ์žˆ๋Š”๋ฐ, ํŠนํžˆ MLC 64Gb ์™€ 128Gb ๊ฐ€๊ฒฉ์ด ๊ฐ๊ฐ 9.9%, 9.5% ๊ธ‰๋“ฑํ•˜๋ฉฐ ์ฃผ๊ฐ€์—๋„ ์˜ํ–ฅ์„ ๋ฏธ์น˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋งˆ์ดํฌ๋ก ์€ ์ฃผ๊ฐ„ ์ฃผ๊ฐ€๊ฐ€ ๋ฌด๋ ค 15%๋‚˜ ํญ๋“ฑํ–ˆ๊ณ , HPE ์˜ AI ๋„คํŠธ์›Œํ‚น ์„œ๋ฒ„ ๋งค์ถœ๋„ ์ „๋…„ ๋Œ€๋น„ 152%๋‚˜ ์„ฑ์žฅํ•˜๋ฉฐ ๋งˆ์ง„ ๊ฐœ์„  ํšจ๊ณผ๋ฅผ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค.

๐Ÿ’กํ•ต์‹ฌ ํฌ์ธํŠธ

์‹œ์žฅ์˜ ๋ˆˆ์ด ๊ฐ€๊ฒฉ ์ƒ์Šน์— ๊ฐ€๋ ค ๋†“์นœ '๊ตฌ์กฐ์  ์ˆ˜ํ˜œ'์˜ ์‹ค์ฒด

ํ•˜์ง€๋งŒ ์‹œ์žฅ์€ ์•„์ง ์ด ์‚ฐ์—…์˜ ๊ตฌ์กฐ์  ๋ณ€ํ™”๋ฅผ ์™„์ „ํžˆ ๋ฐ˜์˜ํ•˜์ง€ ๋ชปํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ํ˜ธ๋ฅด๋ฌด์ฆˆ ํ•ดํ˜‘ ๋ด‰์‡„ ๋ถˆํ™•์‹ค์„ฑ์œผ๋กœ ์›์œ  ๊ฐ€๊ฒฉ์ด ์ฃผ๊ฐ„ 8.6% ๊ธ‰๋“ฑํ•˜๋ฉฐ ๋ณ€๋™์„ฑ์ด ์ปค์ง€๊ณ  ์žˆ์ง€๋งŒ, ์˜คํžˆ๋ ค ๋ฉ”๋ชจ๋ฆฌ ๊ฐ€๊ฒฉ ์ƒ์Šน์— ๋œ ๋ฏผ๊ฐํ•œ AI ๋„คํŠธ์›Œํ‚น ์„œ๋ฒ„์™€ ๊ณ ์„ฑ๋Šฅ ์ถ”๋ก  ์นฉ ์ˆ˜์š”๊ฐ€ ํญ๋ฐœํ•˜๊ณ  ์žˆ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ์˜ค๋ผํด์˜ ๊ฒฝ์šฐ IaaS ๋งค์ถœ์ด ์ „๋…„ ๋Œ€๋น„ 84% ์„ฑ์žฅํ–ˆ๊ณ , ๋ฉ€ํ‹ฐํด๋ผ์šฐ๋“œ DB ์™€ AI ์ธํ”„๋ผ ๋งค์ถœ์€ ๊ฐ๊ฐ 531%, 243%๋‚˜ ํญ์ฆํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋‹จ์ˆœํ•œ ์‚ฌ์ดํด ์ƒ์Šน์ด ์•„๋‹ˆ๋ผ, AI ์—ฐ์‚ฐ ๊ตฌ์กฐ๊ฐ€ ๋ณ€ํ™”ํ•จ์— ๋”ฐ๋ผ ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰๊ณผ ์ข…๋ฅ˜๊ฐ€ ๊ทผ๋ณธ์ ์œผ๋กœ ๋‹ฌ๋ผ์ง€๊ณ  ์žˆ์Œ์„ ์˜๋ฏธํ•˜๋ฉฐ, ์•„์ง ์ฃผ๊ฐ€์— ์™„์ „ํžˆ ๋ฐ˜์˜๋˜์ง€ ์•Š์€ ๊ฑฐ๋Œ€ํ•œ ๊ธฐํšŒ์ž…๋‹ˆ๋‹ค.

๐ŸŽฏ์ˆ˜ํ˜œ ์ข…๋ชฉ
์„ธ๋ ˆ๋ธŒ๋ผ์Šค(๊ด€๋ จ์ฃผ): WSE ๊ธฐ์ˆ ๊ณผ AWS ํ˜‘๋ ฅ์œผ๋กœ ์ถ”๋ก  ์‹œ์žฅ ์„ ์ 
โš ๏ธ๋ฆฌ์Šคํฌ

ํ˜ธ๋ฅด๋ฌด์ฆˆ ํ•ดํ˜‘ ๋ด‰์‡„ ๋ถˆํ™•์‹ค์„ฑ์œผ๋กœ ์›์œ  ๊ฐ€๊ฒฉ์ด ์ฃผ๊ฐ„ 8.6% ๊ธ‰๋“ฑํ•˜๋ฉฐ ๊ธ€๋กœ๋ฒŒ ๊ณต๊ธ‰๋ง ๋น„์šฉ์ด ๋‹ค์‹œ ์ƒ์Šนํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ๋ฏธ๊ตญ์˜ ์‚ฌ๋ชจ์‹ ์šฉ ์ž์‚ฐ ๋ถ€์‹ค ๋ฆฌ์Šคํฌ๊ฐ€ ๋ถ€๊ฐ๋˜๋ฉฐ, ๋‹จ๊ธฐ์ ์œผ๋กœ ๋ฏธ๊ตญ ๋ฐ ๊ธ€๋กœ๋ฒŒ ์ฆ์‹œ์˜ ๋ณ€๋™์„ฑ์ด ์ง€์†๋  ์ˆ˜ ์žˆ์–ด ํˆฌ์ž ์‹ฌ๋ฆฌ๊ฐ€ ์œ„์ถ•๋  ์šฐ๋ ค๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

๐ŸŽฏ๊ฒฐ๋ก 

๋‹จ์ˆœํ•œ ๊ฐ€๊ฒฉ ์ƒ์Šน์„ ๋„˜์–ด AI ์—ฐ์‚ฐ ๊ตฌ์กฐ์˜ ๋Œ€์ „ํ™˜๊ธฐ์— ์ง„์ž…ํ–ˆ์œผ๋ฏ€๋กœ, ๋ฉ”๋ชจ๋ฆฌ ๊ฐ€๊ฒฉ ์ƒ์Šน๊ณผ ์•„ํ‚คํ…์ฒ˜ ๋ณ€ํ™”์— ๊ฐ€์žฅ ๋ฏผ๊ฐํ•˜๊ฒŒ ๋ฐ˜์‘ํ•˜๋Š” ๊ธฐ์—…๋“ค์„ ์„ ์ œ์ ์œผ๋กœ ๋งค์ˆ˜ํ•ด์•ผ ํ•  ์‹œ์ ์ž…๋‹ˆ๋‹ค.

GPU ๋…์ฃผ ๋๋‚ฌ๋‹ค, ์„ธ๋ ˆ๋ธŒ๋ผ์Šค์™€ AWS์˜ '์ถ”๋ก  ๋ถ„๋ฆฌ'๊ฐ€ ๋ฉ”๋ชจ๋ฆฌ ์‹œ์žฅ์„ ๋’คํ”๋“ ๋‹ค โ€” ์œ ์ง„ํˆฌ์ž์ฆ๊ถŒ | WebStock