AI vs ์ธ๊ฐ, ๋ฒค์น๋งํฌ๋ก ์์๋ณด๋ AI ๊ธฐ์ ๋ณ ์ฑ์ฅ by voronoiapp.com
๋ด๊ฐ ์ผํ๊ณ AI๊ฐ ์ค๊ฑฐ์งํ ์ค ์์๋๋
AI๊ฐ ์ผํ ๋ ๋ด๊ฐ ์ค๊ฑฐ์งํ๊ฒ ์๊ฒผ๋ค.
๋ค. ์ต๊ทผ ์์ฑAI๋ก ๋ํ๋๋ ์ฌ๋ฌ ์ธ๊ณต์ง๋ฅ(AI) ์๋น์ค๊ฐ ๋ณด์ฌ์ฃผ๋ ๋๋ผ์ด ๊ฒฐ๊ณผ๋ฌผ์ ๋ณด๋ฉด์ ๋ง์ ์ด๋ค์ด ๊ฐ์ง๊ณ ์๋ ์๊ฐ์ ๋จํธ์ ๋๋ค. ์ฐฝ์์ ์ธ ์ผ์ ์ธ๊ฐ์ด ํ๊ณ ๋ฐ๋ณต์ ์ด๊ณ ๋จ์ํ ์ผ์ AI๊ฐ ํ์ฌ๋ ๋ก๋ด์ด ํ ์ค ์์๋๋ ํ์ค์ ์ฐฝ์์ ์ด๋ผ๊ณ ๋๊ผ๋ ์ผ์์๋ถํฐ AI์๊ฒ ์๋ฆฌ๋ฅผ ๋ด์ค์ผ ํ ๋ฏํ ์ํฉ์ด ๋์ด๊ฐ๊ณ ์๋๋ฐ์. ์ง๊ธ๊น์ง AI๊ฐ ๋ณด์ฌ์ค ๊ธฐ์ ์ ์ธ ์ฑ๊ณผ๋ ์ด๋จ๊น์? ์ธ๊ฐ์ ์ผ๋ง๋ ๋์ฒดํ ์์ค์ผ๊น์?
voronoi๊ฐ ์คํ ํผ๋ ๋ํ๊ต์ 2025 AI ์ธ๋ฑ์ค ๋ฆฌํฌํธ(2025 AI Index Report)๋ฅผ ๋ฐํ์ผ๋ก ์ ๋ฆฌํ ์ด ์ธํฌ๊ทธ๋ํฝ์ AI์ ๊ด๋ จ๋ 8๊ฐ์ง ๋ฒค์น๋งํฌ๋ฅผ ํตํด AI๊ฐ ์ธ๊ฐ์ ์ผ๋ง๋ ๋ฐ๋ผ์๋์ง๋ฅผ ์๊ฐํํ๊ณ ์์ต๋๋ค. 2012๋
๋ถํฐ 2024๋
๊น์ง AI๊ฐ ๊ฐ๊ฐ์ ๋ฐฉ๋ฉด์์ ์ด๋ค ์๋๋ก ๋ฐ์ ํด ์๋์ง ์ธ๊ฐ์ ์ธ์ ๋ฐ์ด๋์๋์ง ๋ฑ์ ์ดํด๋ณผ ์ ์๋๋ก์ด์.
์ฌ๊ธฐ์ ์ธ๊ธ๋ 8๊ฐ์ง ๋ฒค์น๋งํฌ๋ ์ด๋ฏธ์ง ๋ถ๋ฅ(Image Classification), ์๊ฐ์ ์ถ๋ก (Visual Reasoning), ์ค๊ฐ ์์ค์ ๋
ํด(Medium-level Reading Comprehension), ์์ด ์ดํด(English Language Understanding), ๋ค์ค ์ธ์ด ์ดํด(Multitask Language Understanding), ๊ฒฝ์ ์์ค์ ์ํ(Competition-level Mathematics), ๋ฐ์ฌ ์์ค์ ๊ณผํ ๋ฌธ์ (PhD-level Science Questions), ๋ค์ค์ ์ดํด์ ์ถ๋ก (Multimodal Understanding and Reasoning) ๋ฑ์ธ๋ฐ์.
๊ฐ์ฅ ๋จผ์ ์์๋ ์ด๋ฏธ์ง ๋ถ๋ฅ์ ๊ฒฝ์ฐ 2012๋
์ 90% ์์ค์ด์์ง๋ง, 2016๋
์ ์ธ๊ฐ์ ๋ฐ์ด๋์์ต๋๋ค. ์๊ฐ์ ์ถ๋ก ์ ๊ฒฝ์ฐ 2016๋
์ 80%๋ก ์ถ๋ฐํด์ 2021๋
์ ์ธ๊ฐ์ ๋ฐ์ด๋์๊ณ ์. ์ค๊ฐ ์์ค์ ๋
ํด๋ 2017๋
82%๋ก ์ถ๋ฐํด์ 2019๋
์ ์ธ๊ฐ ์์ค์ ๋ฐ์ด๋์์ต๋๋ค. ์์ด ์ดํด๋ 2019๋
์ ์ด๋ฏธ 94%๋ก ์์ํด์ 2021๋
์ ์ธ๊ฐ ์์ค์ ๋ฐ์ด๋์๋๋ฐ ์ด๋ค์ด ์๋์ ์ผ๋ก ์ค๋์ ๋ถํฐ ์ฐ๊ตฌ๋๊ณ ์ค๋น๋๋ค๋ฉด ๋ค๋ฅธ 4๊ฐ์ง๋ ๋ ๊ทน์ ์
๋๋ค.
๋ค์ค ์ธ์ด ์ดํด๋ 2019๋
์ 36%๋ก ๋ฎ์์ง๋ง, 2024๋
์ ์ธ๊ฐ ์์ค์ ๋์ด์ฐ๊ณ , 2021๋
์ ๊ณ ์ 7%๋์๋ ๊ฒฝ์ ์์ค์ ์ํ์ 2024๋
์ ์ธ๊ฐ ์์ค์ ๋์ด์ฐ์ต๋๋ค. ๋ฐ์ฌ ์์ค์ ๊ณผํ ๋ฌธ์ ๋ 2023๋
์ 47%๋ก ๋ฑ์ฅํ๋๋ 1๋
๋ง์ธ 2024๋
์ ์ธ๊ฐ ์์ค์ ๋ฐ์ด๋์๊ณ , ์์ง ์ธ๊ฐ ์์ค์ ๋์ง ๋ชปํ ์ ์ผํ ์์์ธ ๋ค์ค์ ์ดํด์ ์ถ๋ก ์ 2023๋
์ 71% ์ ๋์์ง๋ง, 2024๋
์ 94%๋ก ์ฌ๋ผ์๋ฉฐ ์ธ๊ฐ์ ๊ทผ์ ํ๊ณ ์.
์ง๊ธ ์ด ์๊ฐ์์๋ ์ฑGPT๋ ์ ๋ฏธ๋์ด, ํด๋ก๋ ๊ฐ์ ๋ค์ํ AI ๋ชจ๋ธ์ด ๊ฐ๋ฐ๋์ด ์๋ก ๋ฑ์ฅํ๊ฑฐ๋ ๋ฒ์ ์
์ ํ๋ฉด์ ํ๊ฐ๋ฐ๋ ์ํฉ์ด๋ค ๋ณด๋ ์ด 8๊ฐ์ง ์ธ์๋ ๋ค์ํ ์งํ์ ๋ํด ์์ผ๋ก๋ ํ๊ฐ๋ฐ๊ฒ ๋ ํ
๋ฐ์. ๋น ๋ฅด๊ฒ ์ฑ์ฅํ๋ฉฐ ์ฌ๋ฌ ๋ถ์ผ์์ ์ธ๊ฐ์ ๋ฐ์ด๋๋ ๊ฑธ ๋ณด๋ฉด... ์ง์ง ์ค์นด์ด๋ท์ ์๋๊ฐ ๊ทธ๋ฆฌ ๋จธ์ง์์ ๋ชจ์์ธ๋ฐ ๊ทธ๋ ์ ๋ ๋ญ ํ๋ฉด ์ข์๊น์?ใ
Comparing AI vs. Human Performance in Technical Tasks ๐งฎ
What We're Showing AI systems' performance relative to human baselines for eight AI benchmarks measuring tasks including: Image classification Visual reโฆ
www.voronoiapp.com
๋๊ธ ์์ญ