AI vs 인간, 벤치마크로 알아보는 AI 기술별 성장 by voronoiapp.com

N* Tech/Science

by 라디오키즈 2025. 6. 11. 19:00

내가 일하고 AI가 설거지할 줄 알았더니
AI가 일할 때 내가 설거지하게 생겼다.

네. 최근 생성AI로 대표되는 여러 인공지능(AI) 서비스가 보여주는 놀라운 결과물을 보면서 많은 이들이 가지고 있는 생각의 단편입니다. 창의적인 일은 인간이 하고 반복적이고 단순한 일을 AI가 탑재된 로봇이 할 줄 알았더니 현실은 창의적이라고 느꼈던 일에서부터 AI에게 자리를 내줘야 할 듯한 상황이 되어가고 있는데요. 지금까지 AI가 보여준 기술적인 성과는 어떨까요? 인간을 얼마나 대체할 수준일까요?

AI는 우리 인간을 얼마나 따라왔을까?

voronoi가 스탠퍼드 대학교의 2025 AI 인덱스 리포트(2025 AI Index Report)를 바탕으로 정리한 이 인포그래픽은 AI와 관련된 8가지 벤치마크를 통해 AI가 인간을 얼마나 따라왔는지를 시각화하고 있습니다. 2012년부터 2024년까지 AI가 각각의 방면에서 어떤 속도로 발전해 왔는지 인간을 언제 뛰어넘었는지 등을 살펴볼 수 있도록이요.

hai_ai_index_report_2025.pdf

8.79MB

여기서 언급된 8가지 벤치마크는 이미지 분류(Image Classification), 시각적 추론(Visual Reasoning), 중간 수준의 독해(Medium-level Reading Comprehension), 영어 이해(English Language Understanding), 다중 언어 이해(Multitask Language Understanding), 경쟁 수준의 수학(Competition-level Mathematics), 박사 수준의 과학 문제(PhD-level Science Questions), 다중적 이해와 추론(Multimodal Understanding and Reasoning) 등인데요.

가장 먼저 시작된 이미지 분류의 경우 2012년엔 90% 수준이었지만, 2016년에 인간을 뛰어넘었습니다. 시각적 추론의 경우 2016년에 80%로 출발해서 2021년에 인간을 뛰어넘었고요. 중간 수준의 독해는 2017년 82%로 출발해서 2019년에 인간 수준을 뛰어넘었습니다. 영어 이해는 2019년에 이미 94%로 시작해서 2021년에 인간 수준을 뛰어넘었는데 이들이 상대적으로 오래전부터 연구되고 준비됐다면 다른 4가지는 더 극적입니다.

다중 언어 이해는 2019년엔 36%로 낮았지만, 2024년에 인간 수준을 넘어섰고, 2021년에 고작 7%대였던 경쟁 수준의 수학은 2024년에 인간 수준을 넘어섰습니다. 박사 수준의 과학 문제도 2023년에 47%로 등장하더니 1년 만인 2024년에 인간 수준을 뛰어넘었고, 아직 인간 수준을 넘지 못한 유일한 요소인 다중적 이해와 추론은 2023년엔 71% 정도였지만, 2024년에 94%로 올라서며 인간에 근접했고요.

지금 이 시간에서도 챗GPT나 제미나이, 클로드 같은 다양한 AI 모델이 개발되어 새로 등장하거나 버전업을 하면서 평가받는 상황이다 보니 이 8가지 외에도 다양한 지표에 대해 앞으로도 평가받게 될 텐데요. 빠르게 성장하며 여러 분야에서 인간을 뛰어넘는 걸 보면... 진짜 스카이넷의 시대가 그리 머지않은 모양인데 그때 저는 뭘 하면 좋을까요?ㅎ

Comparing AI vs. Human Performance in Technical Tasks 🧮

What We're Showing AI systems' performance relative to human baselines for eight AI benchmarks measuring tasks including: Image classification Visual re…

www.voronoiapp.com

저작자표시 비영리 동일조건 (새창열림)

고정 헤더 영역

검색 레이어

검색 영역

상세 컨텐츠

AI vs 인간, 벤치마크로 알아보는 AI 기술별 성장 by voronoiapp.com

본문

AI는 우리 인간을 얼마나 따라왔을까?

관련글 더보기

멘사 IQ 테스트를 AI가 한다면 IQ는 얼마일까? by voronoiapp.com

미국산이지만, 세계가 함께 만드는 보잉 737 항공기 by Julie Peasley

2030년 에너지 전환 위해 필요한 광물과 광산수 by voronoiapp.com

2023년 글로벌 기술 제조 기업의 R&D 투자 변화 by voronoiapp.com

댓글 영역

티스토리툴바

검색 레이어

검색 영역

상세 컨텐츠

AI vs 인간, 벤치마크로 알아보는 AI 기술별 성장 by voronoiapp.com

본문

AI는 우리 인간을 얼마나 따라왔을까?

관련글 더보기

멘사 IQ 테스트를 AI가 한다면 IQ는 얼마일까? by voronoiapp.com

미국산이지만, 세계가 함께 만드는 보잉 737 항공기 by Julie Peasley

2030년 에너지 전환 위해 필요한 광물과 광산수 by voronoiapp.com﻿

2023년 글로벌 기술 제조 기업의 R&D 투자 변화 by voronoiapp.com

댓글 영역

티스토리툴바

2030년 에너지 전환 위해 필요한 광물과 광산수 by voronoiapp.com