logo
|
Blog
  • deep gadget λ°”λ‘œκ°€κΈ°β†—οΈ
μΈμ‚¬μ΄νŠΈ

πŸš€ μ΅œμ‹  AI 연ꡬ와 κ³ μ„±λŠ₯ μΈν”„λΌμ˜ λ§Œλ‚¨. Energy-Based Transformer μ‹œλŒ€λ₯Ό μ—¬λŠ” μƒˆλ‘œμš΄ κ°€λŠ₯μ„±

Energy-Based Transformer(EBT)λŠ” AI μΆ”λ‘  λ°©μ‹μ˜ ν˜μ‹ μ„ μ œμ‹œν•©λ‹ˆλ‹€. EBT의 λ“±μž₯κ³Ό ν•¨κ»˜ κ³ μ„±λŠ₯ μ»΄ν“¨νŒ… 인프라가 μ™œ μ€‘μš”ν•œμ§€, λ§€λ‹ˆμ½”μ–΄μ†Œν”„νŠΈκ°€ μ œμ‹œν•©λ‹ˆλ‹€.
MANYCORESOFT's avatar
MANYCORESOFT
Aug 04, 2025
πŸš€ μ΅œμ‹  AI 연ꡬ와 κ³ μ„±λŠ₯ μΈν”„λΌμ˜ λ§Œλ‚¨. Energy-Based Transformer μ‹œλŒ€λ₯Ό μ—¬λŠ” μƒˆλ‘œμš΄ κ°€λŠ₯μ„±
Contents
🧠 μƒˆλ‘œμš΄ μΆ”λ‘  방식, Energy-Based Transformer (EBT)πŸ” μ™œ μ£Όλͺ©λ°›κ³  μžˆμ„κΉŒ?⚠️ κΉŠμ–΄μ§„ μΆ”λ‘ , μ»€μ§€λŠ” μ—°μ‚° μžμ› μš”κ΅¬πŸ’‘ 더 κΉŠμ€ AIλ₯Ό μœ„ν•œ 인프라 μ€€λΉ„πŸ› οΈ λ§€λ‹ˆμ½”μ–΄μ†Œν”„νŠΈμ˜ 인프라 μ—­λŸ‰πŸ”§ κ³ μ„±λŠ₯ AI ν•™μŠ΅Β·μΆ”λ‘ μ„ μœ„ν•œ 핡심 μ†”λ£¨μ…˜:🌐 미래λ₯Ό μœ„ν•œ 기술 인프라 νŒŒνŠΈλ„ˆ

EBT Thinking process visualization

EBT의 사고 ν”„λ‘œμ„ΈμŠ€ μ‹œκ°ν™”. (좜처: Energy-Based Transformers are Scalable Learners and Thinkers, 2 Jul 2025, Alexi Gladstone μ™Έ)

🧠 μƒˆλ‘œμš΄ μΆ”λ‘  방식, Energy-Based Transformer (EBT)

μ§€λ‚œ 7μ›”, λ²„μ§€λ‹ˆμ•„λŒ€ν•™κ΅, ν•˜λ²„λ“œλŒ€ν•™κ΅, μŠ€νƒ νΌλ“œλŒ€ν•™κ΅, 그리고 μ•„λ§ˆμ‘΄ μƒμ„±ν˜• AI νŒ€μ΄ κ³΅λ™μœΌλ‘œ λ°œν‘œν•œ Energy-Based Transformer(EBT)λŠ” κΈ°μ‘΄ AI λͺ¨λΈμ˜ μž‘λ™ 방식을 근본적으둜 μž¬ν•΄μ„ν•œ μ—°κ΅¬λ‘œ μ£Όλͺ©λ°›κ³  μžˆμŠ΅λ‹ˆλ‹€.

EBTλŠ” κΈ°μ‘΄ Transformer처럼 ν•œ λ²ˆμ— 좜λ ₯을 μƒμ„±ν•˜λŠ” λŒ€μ‹ , 좜λ ₯값을 반볡적으둜 μˆ˜μ •ν•˜λ©° 'μ—λ„ˆμ§€ ν•¨μˆ˜'λ₯Ό μ΅œμ†Œν™”ν•˜λŠ” μƒˆλ‘œμš΄ λ°©μ‹μ˜ μΆ”λ‘  ꡬ쑰λ₯Ό λ„μž…ν–ˆμŠ΅λ‹ˆλ‹€.
이 과정은 마치 μ‚¬λžŒμ΄ λ‹΅μ•ˆμ„ μž‘μ„±ν•  λ•Œ, 처음 μ“΄ 닡을 μ—¬λŸ¬ 번 고치며 더 λ‚˜μ€ 닡을 μ°Ύμ•„κ°€λŠ” 사고 방식과 μœ μ‚¬ν•©λ‹ˆλ‹€.

μ΄λŸ¬ν•œ 반볡적 μΆ”λ‘  κ΅¬μ‘°λŠ” 특히 ν•™μŠ΅μ— ν¬ν•¨λ˜μ§€ μ•Šμ€ 데이터(Out-of-Distribution)에 λŒ€ν•œ μΌλ°˜ν™” λŠ₯λ ₯μ—μ„œλ„ 높은 μ„±λŠ₯을 보이며, κΈ°μ‘΄ λ°©μ‹μœΌλ‘œλŠ” μ–΄λ €μ› λ˜ μ •λ°€ν•œ μ˜ˆμΈ‘μ„ κ°€λŠ₯ν•˜κ²Œ ν•©λ‹ˆλ‹€.

πŸ” μ™œ μ£Όλͺ©λ°›κ³  μžˆμ„κΉŒ?

EBT의 핡심은 μΆ”λ‘  λ‹¨κ³„μ—μ„œλ„ 마치 ν•™μŠ΅μ²˜λŸΌ 반볡 μ΅œμ ν™”λ₯Ό μˆ˜ν–‰ν•œλ‹€λŠ” μ μž…λ‹ˆλ‹€. 이둜 인해:

  • βœ… κΈ°μ‘΄ Transformer λŒ€λΉ„ 더 높은 정밀도와 μΌλ°˜ν™” λŠ₯λ ₯ 확보

  • βœ… μΆ”λ‘  과정에 System 2 사고(느리고 μ‹ μ€‘ν•œ 사고 방식)에 κ°€κΉŒμš΄ ꡬ쑰 반영

  • βœ… 좜λ ₯ 후보λ₯Ό μ‘°μ •ν•˜λ©° μ μ§„μ μœΌλ‘œ 정닡에 μˆ˜λ ΄ν•˜λŠ” 계산적 사고 방식 κ΅¬ν˜„

ν•˜μ§€λ§Œ μ΄λŸ¬ν•œ μž₯점은 λΉ„μš© μ—†λŠ” μ§„ν™”κ°€ μ•„λ‹™λ‹ˆλ‹€.

⚠️ κΉŠμ–΄μ§„ μΆ”λ‘ , μ»€μ§€λŠ” μ—°μ‚° μžμ› μš”κ΅¬

EBTλŠ” Transformer++와 λ™μΌν•œ 쑰건(데이터, μ—°μ‚°λŸ‰ λ“±)μ—μ„œ 더 λΉ λ₯΄κ²Œ μ„±λŠ₯을 ν–₯μƒμ‹œν‚€λŠ” 높은 ν•™μŠ΅ νš¨μœ¨μ„±μ„ 보이며, 특히 FLOPs(λΆ€λ™μ†Œμˆ˜μ  μ—°μ‚°λŸ‰), νŒŒλΌλ―Έν„° 수, λͺ¨λΈ 깊이 λ“± λ‹€μ–‘ν•œ μ§€ν‘œμ—μ„œ μ΅œλŒ€ 35% ν–₯μƒλœ scaling rateλ₯Ό κΈ°λ‘ν–ˆμŠ΅λ‹ˆλ‹€.

EBT_language learning scalability (좜처: 상동)

λ‹€λ§Œ, μΆ”λ‘  λ‹¨κ³„μ—μ„œλŠ” 좜λ ₯값을 반볡적으둜 μ‘°μ •ν•˜λŠ” μ΅œμ ν™” 기반의 ꡬ쑰둜 인해 일반적인 Transformer보닀 μΆ”λ‘  μ‹œκ°„ 및 μ—°μ‚°λŸ‰μ΄ 더 클 수 있으며, 이둜 인해 μ‹€μ‚¬μš© μ‹œμ—λŠ” 보닀 κ°•λ ₯ν•œ μ—°μ‚° μžμ›μ΄ μš”κ΅¬λ  수 μžˆμŠ΅λ‹ˆλ‹€.

ν˜„μž¬ λ…Όλ¬Έμ—μ„œλŠ” μ•½ 8μ–΅ νŒŒλΌλ―Έν„° 규λͺ¨μ˜ λͺ¨λΈμ„ 기반으둜 μ‹€ν—˜λ˜μ—ˆμœΌλ©°, 더 큰 규λͺ¨μ˜ λͺ¨λΈμ—μ„œλ„ λ™μΌν•œ μ„±λŠ₯ 효율이 μœ μ§€λ μ§€λŠ” ν–₯ν›„ 검증이 ν•„μš”ν•œ κ³Όμ œμž…λ‹ˆλ‹€.

이둜 인해 ν•„μš”ν•œ 인프라 쑰건은 λ‹€μŒκ³Ό κ°™μŠ΅λ‹ˆλ‹€:

  • πŸ“Œ GPU λ©”λͺ¨λ¦¬ 및 μ—°μ‚° μžμ› λŒ€ν­ 증가

  • πŸ“Œ μΆ”λ‘  λ‹¨κ³„μ—μ„œμ˜ 반볡 계산 β†’ μ „λ ₯ μ†ŒλΉ„ 및 λ°œμ—΄ 증가

  • πŸ“Œ 지속적 κ³ μ„±λŠ₯ μš΄μ˜μ„ μœ„ν•œ 냉각 및 μ•ˆμ •μ„± 확보 ν•„μš”

πŸ’‘ 더 κΉŠμ€ AIλ₯Ό μœ„ν•œ 인프라 μ€€λΉ„

EBTλŠ” λ‹¨μˆœν•œ μ—°κ΅¬μš© μ•Œκ³ λ¦¬μ¦˜μ΄ μ•„λ‹ˆλΌ, ν–₯ν›„ AI λͺ¨λΈλ“€μ΄ λ‚˜μ•„κ°ˆ λ°©ν–₯성을 μƒμ§•ν•©λ‹ˆλ‹€.


즉, μ •ν™•μ„±κ³Ό 신뒰성을 μ€‘μ‹œν•˜λŠ” 고차원적 좔둠을 μœ„ν•΄μ„œλŠ” 더 이상 λ‹¨μˆœν•œ μ—°μ‚° κ°€μ†λ§ŒμœΌλ‘œλŠ” λΆ€μ‘±ν•˜λ©°, 인프라 μ „λ°˜μ˜ ν˜μ‹ μ΄ ν•¨κ»˜ μš”κ΅¬λœλ‹€λŠ” κ²ƒμž…λ‹ˆλ‹€.

λ§€λ‹ˆμ½”μ–΄μ†Œν”„νŠΈμ˜ 인프라 ꡬ좕 사둀 (고객사: κ΅­λ‚΄ μ΅œλŒ€ AI ν΄λΌμš°λ“œ)

πŸ› οΈ λ§€λ‹ˆμ½”μ–΄μ†Œν”„νŠΈμ˜ 인프라 μ—­λŸ‰

λ§€λ‹ˆμ½”μ–΄μ†Œν”„νŠΈλŠ” μ΄λŸ¬ν•œ μƒˆλ‘œμš΄ AI μ›Œν¬λ‘œλ“œμ— λŒ€μ‘ν•  수 μžˆλ„λ‘, κ³ μ„±λŠ₯ μ»΄ν“¨νŒ… 인프라λ₯Ό μ„€κ³„ν•˜κ³  곡급해 μ™”μŠ΅λ‹ˆλ‹€.

πŸ”§ κ³ μ„±λŠ₯ AI ν•™μŠ΅Β·μΆ”λ‘ μ„ μœ„ν•œ 핡심 μ†”λ£¨μ…˜:

βœ… μ΅œμ‹  AI Chip을 λͺ¨λ‘ μ§€μ›ν•˜λŠ” 앑체냉각 μ„œλ²„
 – λ°œμ—΄μ„ μ΅œμ†Œν™”ν•΄ μ—°μ‚° μ„±λŠ₯을 μ•ˆμ •μ μœΌλ‘œ μœ μ§€
 – 곡간 νš¨μœ¨μ„±κ³Ό μ—λ„ˆμ§€ 절감 효과 λ™μ‹œ 확보

βœ… 고속 λ„€νŠΈμ›Œν¬ 및 μŠ€ν† λ¦¬μ§€ μ†”λ£¨μ…˜
 – λŒ€κ·œλͺ¨ λΆ„μ‚° ν•™μŠ΅, 데이터셋 μ²˜λ¦¬μ— μ΅œμ ν™”
 – NVLink, PCIe Gen5, InfiniBand λ“± 지원

βœ… μœ μ—°ν•œ ν΄λŸ¬μŠ€ν„° ν™•μž₯
 – ν•„μš” μ‹œ λ…Έλ“œ 증섀 κ°€λŠ₯, ν΄λΌμš°λ“œ 연계도 μœ μ—°ν•˜κ²Œ λŒ€μ‘

🌐 미래λ₯Ό μœ„ν•œ 기술 인프라 νŒŒνŠΈλ„ˆ

EBTλŠ” 아직 초기 연ꡬ λ‹¨κ³„μ΄μ§€λ§Œ, 이미 μš°λ¦¬κ°€ μ€€λΉ„ν•΄μ•Ό ν•  λ°©ν–₯을 λͺ…ν™•νžˆ λ³΄μ—¬μ€λ‹ˆλ‹€.
AI λͺ¨λΈμ˜ μ§„ν™”λŠ” 더 μ •κ΅ν•˜κ³  λ³΅μž‘ν•΄μ§€κ³  있으며, 이λ₯Ό μ•ˆμ •μ μœΌλ‘œ κ΅¬λ™ν•˜κΈ° μœ„ν•΄μ„œλŠ” νƒ„νƒ„ν•œ 인프라가 μ „μ œλ˜μ–΄μ•Ό ν•©λ‹ˆλ‹€.

λ§€λ‹ˆμ½”μ–΄μ†Œν”„νŠΈλŠ” μ΄λŸ¬ν•œ 기술 λ³€ν™”μ˜ 흐름을 λˆ„κ΅¬λ³΄λ‹€ λΉ λ₯΄κ²Œ ν¬μ°©ν•˜κ³ ,
κΈ°μ—…κ³Ό 연ꡬ기관이 μƒˆλ‘œμš΄ AI μ›Œν¬λ‘œλ“œλ₯Ό ν˜„μ‹€ν™”ν•  수 μžˆλ„λ‘ ν˜„μ‹€μ μ΄κ³  κ²€μ¦λœ 인프라 μ†”λ£¨μ…˜μ„ μ œκ³΅ν•©λ‹ˆλ‹€.

EBT와 같은 μ°¨μ„ΈλŒ€ AI μ›Œν¬λ‘œλ“œμ— λŒ€λΉ„ν•œ λ§žμΆ€ν˜• μ„œλ²„ 및 κ³ μ„±λŠ₯ μ»΄ν“¨νŒ… 인프라에 λŒ€ν•΄ κΆκΈˆν•˜μ‹  점이 μžˆμœΌμ‹ κ°€μš”?

λ§€λ‹ˆμ½”μ–΄μ†Œν”„νŠΈκ°€ κΈ°μ—…κ³Ό μ—°κ΅¬κΈ°κ΄€μ˜ 기술적 도전을 ν•¨κ»˜ν•˜κ² μŠ΅λ‹ˆλ‹€.
κΆκΈˆν•˜μ‹  점은 μ–Έμ œλ“  μ•„λž˜ λ²„νŠΌμ„ 눌러 λ¬Έμ˜ν•΄μ£Όμ„Έμš”.

Share article
Contents
🧠 μƒˆλ‘œμš΄ μΆ”λ‘  방식, Energy-Based Transformer (EBT)πŸ” μ™œ μ£Όλͺ©λ°›κ³  μžˆμ„κΉŒ?⚠️ κΉŠμ–΄μ§„ μΆ”λ‘ , μ»€μ§€λŠ” μ—°μ‚° μžμ› μš”κ΅¬πŸ’‘ 더 κΉŠμ€ AIλ₯Ό μœ„ν•œ 인프라 μ€€λΉ„πŸ› οΈ λ§€λ‹ˆμ½”μ–΄μ†Œν”„νŠΈμ˜ 인프라 μ—­λŸ‰πŸ”§ κ³ μ„±λŠ₯ AI ν•™μŠ΅Β·μΆ”λ‘ μ„ μœ„ν•œ 핡심 μ†”λ£¨μ…˜:🌐 미래λ₯Ό μœ„ν•œ 기술 인프라 νŒŒνŠΈλ„ˆ

deep gadget by ManyCoreSoft

RSSΒ·Powered by Inblog