์ธ์ด๋ฅผ ๋์ด ์๋ช ์ผ๋ก, ์๋ช ์ ๋์ด ์ฐ์ฃผ๋ก
๋จธ๋ฆฌ๋ฅผ ๋ง์ ๊ฒ ๊ฐ์์ต๋๋ค. ์ด์ (6์ 2์ผ) ์ค๊ตญ ํ์ง์ ์ง์ธ๋ค๋ก๋ถํฐ ๋ ๊ฐ์ ์์์ ๋ค์์ ๋์. ํ๋๋ ๋ฐ์ดํธ๋์ค(ByteDance) ์จ๋(Seed) ํ์ ํต์ฌ ์ธ๋ฌผ์ธ ๊ตฌ์ทจ์์ทจ์(้กพๅ จๅ จ, Quanquan Gu)์ด ํด์ฌํ๋ค๋ ์์์ด์์ต๋๋ค. ๋ ํ๋๋ ๋ฒ ์ด์ง ์ฐ์ฃผ์ปดํจํ ์ฐ๊ตฌ์(ๅไบฌๅคช็ฉบๆบ็ฎ็ ็ฉถ้ข)์ด ๊ณต์ ์ค๋ฆฝ๋๋ค๋ ์์์ด์์ต๋๋ค. ๋ ์์์ ์ ํ ๋ค๋ฅธ ์ง์ธ๋ค๋ก๋ถํฐ ์์ต๋๋ค. ๊ทธ๋ฐ๋ฐ ๋ฃ๋ ์๊ฐ ๋จธ๋ฆฌ๋ฅผ ๋ง์ ๊ฒ ๊ฐ์ ์ถฉ๊ฒฉ์ด ์์ต๋๋ค. ์ด ๋ ์์์ด ํ๋์ ์ด์ผ๊ธฐ๋ก ๋ค๋ ธ๊ธฐ ๋๋ฌธ์ ๋๋ค. ํ ์ฌ๋์ ๋จ๋ฐฑ์ง ๊ตฌ์กฐ๋ฅผ ํ๊ณ LLM(๊ฑฐ๋ ์ธ์ด ๋ชจ๋ธ)์ ํ๋ จ์ ๋ง๋ฌด๋ฆฌ ํ ํ ๋ค์ ์ฌ์ ์ ์ค๋นํ๊ณ ๊ตญ๊ฐ๋ ๊ทธ ๊ธฐ์ ์ ์ฐ์ฃผ ๊ถค๋ ์๋ก ์ฌ๋ฆฌ๋ ์ธํ๋ผ๋ฅผ ์ธ์ ์ต๋๋ค. ์ด๊ฒ์ ์ฐ์ฐ์ ์ผ์น๊ฐ ์๋ ํ๋์ ๊ฑฐ๋ํ ์ค๊ณ๋ ์์์ ๊ฐ์ ์๊ฐ๋์ ์ผ์ด๋๊ณ ์๋ ์ผ์ ๋๋ค. ๊ตฌ์ทจ์์ทจ์๊ณผ ํ์ฌ๋น์ค์ ํํ์ด๋ก ๊ตฌ์ทจ์์ทจ์. ์ฒญํ๋ํ๊ต ํ๋ถยท์์ฌ, UIUC ์ปดํจํฐ๊ณผํ ๋ฐ์ฌ, ํ๋ฆฐ์คํด ๋ฐ์ฌํ์ฐ๊ตฌ์, ๋ฒ์ง๋์๋ ๊ต์, UCLA ๋ถ๊ต์. 2022๋ ์ฌ๋ก ์ฐ๊ตฌ ํ ๋ก์ฐ์ญ(Sloan Research Fellowship)๊ณผ NSF CAREER Award๋ฅผ ๋์์ ์์ํ๊ณ UCLA์ AGI ์ฐ๊ตฌ์๋ฅผ ์ง์ ์ธ์ด ํ์๊ฐ ๋์ฐ 2023๋ ์ค๊ตญ์ผ๋ก ๋์์ ๋ฐ์ดํธ๋์ค ์จ๋ ํ์ ๋ง๋ค์์ต๋๋ค. ๊ตฌ๊ธ ์ค์นผ๋ผ ํผ์ธ์ฉ 3๋ง ํ. ๊ทธ ์ ํ์ ๋ฌด๊ฒ๊ฐ ์ด๋ ์ ๋์ธ์ง ์๋ ์ฌ๋์ ์๋๋ค. ๊ทธ๊ฐ ์จ๋ ํ์์ ์ฒ์ ์งํํ ์ ๋ฌด๋ AI ๋ฐ์ด์ค(AI for Science)์ด์์ต๋๋ค. ๊ทธ๋ฆฌ๊ณ ๊ทธ๊ฐ ์ด๋ ํ์ด ๋ง๋ค์ด๋ธ ์จ๋ํด๋(SeedFold)๋ ๋ ธ๋ฒจํํ์์ ์ฃผ์ธ๊ณต ์ํํด๋3(AlphaFold3)๋ฅผ ์ฃผ์ ๋จ๋ฐฑ์ง ํ์คํฌ์์ ๋์ด์ฐ์ต๋๋ค. ์ํํด๋ ์๋ฆฌ์ฆ๋ ๊ตฌ๊ธ ๋ฅ๋ง์ธ๋(Google DeepMind) ๊ณต๋์ฐฝ์ ์ ๋ฐ๋ฏธ์ค ํ์ฌ๋น์ค(Demis Hassabis)์ ํต์ฌ ์ฐ๊ตฌ์ ๋๋ค. ์ํํด๋2๋ 50๋ ๋ฌต์ ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์์ธก ๋์ ๋ฅผ ํ์ด 2024๋ ๋ ธ๋ฒจํํ์์ ๋ฐ์๊ณ , ์ํํด๋3๋ ์์ธก ๋ฒ์๋ฅผ ๋จ๋ฐฑ์ง์์ DNAยทRNAยท๋ฆฌ๊ฐ๋ ๋ฑ ๊ฑฐ์ ๋ชจ๋ ์์ฒด๋ถ์๋ก ํ์ฅํ์ต๋๋ค. 190๊ฐ๊ตญ 200๋ง ๋ช ์ ์ฐ๊ตฌ์๊ฐ ์ฐ๋ ๋๊ตฌ์ ๋๋ค. ์๋ ค์ง์ง ์์์ง๋ง ์ค๊ตญ์ ์จ๋ํด๋๋ ๊ทธ ๊ธฐ์ค์ ๋์์ต๋๋ค. 'FoldBench' ์ข ํฉ ํ๊ฐ์์ ๋จ๋ฐฑ์ง ๋จ๋์ฒด ์์ธก lDDT 0.8889, ํญ์ฒด-ํญ์ ๊ณ๋ฉด DockQ 53.21%, ๋จ๋ฐฑ์ง-RNA ๊ณ๋ฉด DockQ 65.31%๋ก ์ํํด๋3๋ฅผ ์ฃผ์ ํ์คํฌ ๋๋ถ๋ถ์์ ์ํํ์ต๋๋ค. ๋ ธ๋ฒจ์์ ๋ฐ์ ์์คํ ์ ์ค๊ตญ ์ธํฐ๋ท ๊ธฐ์ ์ ์ฐ๊ตฌํ์ด ์กฐ์ฉํ ๋์ด์ ๊ฒ์ ๋๋ค. ์จ๋ํ๋กํ ์ค(SeedProteo)๋ ์ ์์(ๅ จๅๅญ) ์์ค์์ ๋จ๋ฐฑ์ง ๊ฒฐํฉ๋ฌผ์ ์ง์ ์ค๊ณํฉ๋๋ค. ๋๋ถ๋ถ์ ๋ฐฉ๋ฒ์ด ๊ณจ๊ฒฉ๋ง ์ค๊ณํ๋ ๊ฒ๊ณผ ๋ฌ๋ฆฌ ์์ฑ ๊ณผ์ ์ ์ฒด๋ฅผ ์ ์ดํ๋ฉฐ, 10๊ฐ ๋ฒค์น๋งํฌ ํ์ ํ ์คํธ์์ ์ํํ๋กํ ์ค(AlphaProteo)ยทRFdiffusionยทBoltzGen ๋ฑ ์ฃผ๋ฅ ๋ฐฉ๋ฒ๋ค์ ์ฑ๊ณต๋ฅ ๊ณผ ๋ค์์ฑ ๋ชจ๋์์ ์์ฐ์ต๋๋ค. DPLM ์๋ฆฌ์ฆ๋ 3์ธ๋์ ๊ฑธ์ณ ๋ฒ์ฉ ๋จ๋ฐฑ์ง ๊ธฐ๋ฐ ๋ชจ๋ธ์ด๋ผ๋ ํ๋์ ๋ฐฉํฅ์ ํฅํด ์งํํ์ต๋๋ค. DPLM(ICML 2024), DPLM-2(ICLR 2025), DPLM-Evo(ICML 2026). 3๋ , 3์ธ๋, ํ ๋ฐฉํฅ์ ์ฐ๊ตฌ ๊ฒฐ๊ณผ์์ต๋๋ค. ๊ทธ๋ฆฌ๊ณ 2025๋ ์ด ๊ตฌ์ทจ์์ทจ์์ ๋ค์ ๋ฐฉํฅ์ ํ์์ต๋๋ค. AI ๋ฐ์ด์ค์์ LLM ์ฌ์ ํ์ต(pretraining)์ผ๋ก. LLM ์ต์ ํยท์ค์ผ์ผ๋ง ํ์ ์ง์ ์ฐฝ์คํ๊ณ , ์ด ํ์ด ๊ตฌ์ถํ ์ฌ์ ํ์ต ์คํ์ด ์จ๋ 2.0(Seed 2.0) ์ฑ๊ณตํ ์ ์์๋ ํ๋ จ์ ํต์ฌ ์ธํ๋ผ๊ฐ ๋์ต๋๋ค. ์ด ๋ชจ๋ธ์ ๋ฐ์ดํธ๋์ค ํ์ฐ์์ง์ ํตํด Doubao ๋ผ๋ ์ค๊ตญ ์ฌ์ฉ์ 1์ AI ์๋น์ค๋ฅผ ํ์์์ผฐ์ต๋๋ค. ํ์ฌ๋น์ค์ ๊ตฌ์ทจ์์ทจ์์ ๋๋ํ ๋์ผ๋ฉด ๊ตฌ์กฐ๊ฐ ๋ณด์ ๋๋ค. ํ ์ฌ๋์ ๋จ๋ฐฑ์ง๋ก ์๋ช ์ ์ธ์ด๋ฅผ ํด๋ ํ๊ณ 2024๋ ๋ ธ๋ฒจํํ์์ ๋ฐ์์ต๋๋ค. ๋ค๋ฅธ ํ ์ฌ๋์ ์กฐ์ฉํ ๋ฒ ์ด์ง์์ ๊ทธ๊ฒ์ ๋์ด์๊ณ 3๋ ๋ง์ ๋ด๋ ค์์ต๋๋ค. ๋ฐฉํฅ์ ๋ฌ๋์ง๋ง ๋ชฉ์ ์ง๋ ๊ฐ์ ๋ณด์ ๋๋ค. ๊ตฌ์ทจ์์ทจ์์ด ํด์ฌํ๋ฉฐ ๋จ๊ธด ๋ง์ง๋ง ๋ฌธ์ฅ์ ์งง๊ณ ๋จํธํ์ต๋๋ค. '์ต๊ณ ์ ๋ชจ๋ธ์ ์์ง ์ค์ง ์์๋ค. ์ค์ผ์ผ๋ง์ ๋ฉ์ถ์ง ์๋๋ค.' AI๋ ์ง๊ธ ๋ค์ฏ ๋ฒ์ ๋์ฝ์ ์ค๋นํ๊ณ ์๋ค ์ด ๋ ์ฌ๋์ ํ๋ณด๊ฐ ์ ํ๋์ ์ด์ผ๊ธฐ๋ก ๋ค๋ฆฌ๋์ง ์ดํดํ๋ ค๋ฉด, AI๊ฐ ์ด๋๋ฅผ ํฅํ๊ณ ์๋์ง๋ฅผ ๋จผ์ ๋ด์ผ ํฉ๋๋ค. ์ฐ๊ตฌ ์ต์ ์ ์ ์๊ฐ์ LLM์ ์ถ๋ฐ์ ์ด์ง ๋ชฉ์ ์ง๊ฐ ์๋๋ผ๋ ๊ฒ์ ๋๋ค. 1๋จ๊ณ LLM. ํ ์คํธ๋ฅผ ์ดํดํ๊ณ , ์ง์์ ์์ฑํ๋ฉฐ, ์ถ๋ก ํฉ๋๋ค. ์ด๊ฒ์ด ์ฐ๋ฆฌ๊ฐ ์ง๊ธ ์ผ์์์ ๊ฒฝํํ๋ AI์ ๋๋ค. GPT๊ฐ ๋ณด์ฌ์ค ๊ฐ์ฅ ์ค์ํ ์ฑ๊ณผ๋ ๊ธ์ ์ ์ฐ๋ ๊ฒ์ด ์๋์์ต๋๋ค. ์ธ๊ณ์ ๋ํ ์ง์์ ์์ถํ๊ณ , ์ถ์ํํ๋ฉฐ, ๊ณํ์ ์๋ฆฝํ๊ณ , ์ถ๋ก ํ๊ณ , ๋๊ตฌ๋ฅผ ์ฌ์ฉํ ์ ์๋ค๋ ๊ฐ๋ฅ์ฑ์ ์ฒ์ ์ฆ๋ช ํ ๊ฒ์ ๋๋ค. LLM์ '์ธ์ด ๋ชจ๋ธ'์ด๋ผ๋ ์ด๋ฆํ๋ฅผ ๋ฌ๊ณ ์์์ง๋ง, ๊ทธ ์ค์ฒด๋ ๋ฒ์ฉ ์ธ์ง ์์ง์ ์ด๊ธฐ ํํ์์ต๋๋ค. 2๋จ๊ณ ๋ฉํฐ๋ชจ๋ฌ(Multimodal). AI๋ ์ด๋ฏธ์งยท์์ยท์์ฑยท์ผ์ ๋ฐ์ดํฐ๋ฅผ ํ๋์ ์ง๋ฅ์ผ๋ก ํตํฉํฉ๋๋ค. ์ธ๊ณ๋ฅผ ์ฝ๋ ๊ฐ๊ฐ์ ํญ์ด ํ ์คํธ๋ฅผ ๋์ด ๋ฌผ๋ฆฌ ํ์ค ์ ์ฒด๋ก ํ์ฅ๋๋ ๋จ๊ณ์ ๋๋ค. ๊ตฌ์ทจ์์ทจ์์ DPLM ์๋ฆฌ์ฆ๊ฐ ๋จ๋ฐฑ์ง ์์ด(ํ ์คํธ)๊ณผ 3D ๊ตฌ์กฐ(๊ณต๊ฐ)๋ฅผ ๋์์ ๋ค๋ฃจ๋ ๊ฒ๋ ์ด ํ์ฅ์ ๋งฅ๋ฝ์ ์์ต๋๋ค. ์ ์ฒด ๋ด์ฉ๋ณด๊ธฐ