News

OpenAI o1: 복잡한 추론을 위한 새로운 언어 모델 도입

OpenAI가 새로운 대형 언어 모델 o1을 선보였다. 이 모델은 강화 학습을 통해 복잡한 추론을 수행할 수 있도록 훈련되었으며, 최종 답변을 생성하기 전에 내부적으로 깊이 있는 사고 과정을 거친다. 이를 통해 AI의 추론 능력이 한층 더 향상되었다.

OpenAI의 o1은 경쟁 프로그래밍 질문(Codeforces)에서 상위 89%의 성과를 기록했으며, 미국 수학 올림피아드(AIME) 예선에서는 미국 상위 500명 학생과 비슷한 수준의 결과를 보였다.

또한, 물리, 생물학, 화학 문제를 다루는 GPQA 벤치마크에서는 인간 박사 수준의 정확도를 뛰어넘는 성과를 거두었다. 현재 모델의 사용 편의성을 개선하기 위한 작업이 진행 중이지만, OpenAI는 초기 버전인 o1-preview를 ChatGPT와 신뢰할 수 있는 API 사용자들에게 공개했다.

💡

pass@1 accuracy는 인공지능 모델이 주어진 문제에서 첫 번째로 생성한 답변이 정답일 확률을 나타낸다. 예를 들어, 모델이 100개의 문제를 풀었을 때 첫 번째 답변이 80문제에서 정답이라면, pass@1 accuracy는 80%가 된다.

강화 학습과 추론 능력

대규모 강화 학습 알고리즘은 모델이 사고 과정을 통해 생산적으로 생각할 수 있도록 훈련한다. o1은 반복적인 훈련을 통해 꾸준히 성능이 향상되었으며, 더 많은 계산 자원을 사용해 생각하는 시간이 길어질수록 더욱 높은 성과를 보였다. 이 접근 방식의 확장 가능성은 기존의 대형 언어 모델 사전 학습 방식과 크게 달라, 이에 대한 연구가 계속 진행되고 있다.

o1은 어려운 추론 테스트에서 GPT-4o보다 성능이 많이 좋아졌다. 실선 막대는 pass@1 정확도를 보여주고, 음영 영역은 64개 샘플을 이용한 다수결 결과를 나타냈다.

성능 평가 결과

o1의 성능을 확인하기 위해 인간 시험과 다양한 머신러닝 벤치마크에서 모델을 평가했다. 그 결과, 대부분의 추론 중심 작업에서 GPT-4o를 크게 앞서는 성과를 보였다.

특히 AIME 시험에서는 GPT-4o가 평균 12%의 문제를 해결한 데 비해, o1은 74%를 해결했고, 학습된 스코어링 기능을 적용하자 성능이 93%까지 향상되었다. 또한, GPQA-diamond라는 어려운 지능 벤치마크에서도 인간 박사 전문가들을 뛰어넘는 성과를 보여주었다.

o1은 GPT-4o에 비해 다양한 벤치마크에서 성능이 향상되었으며, MMLU의 57개 하위 카테고리 중 54개에서 개선되었다. 그중 7개를 예시로 제시했다.

연쇄적 사고(Chain of Thought)

o1은 어려운 문제에 답하기 전에 연쇄적 사고 과정을 거친다. 이를 통해 모델은 복잡한 문제를 단순한 단계로 나누어 해결하고, 잘못된 접근을 인식하고 수정하는 능력을 배운다. 이 과정은 모델의 추론 능력을 크게 향상시키며, 문제 해결에 있어 보다 효율적인 접근 방식을 사용하게 한다.

코딩 능력 향상

o1을 기반으로 프로그래밍 능력을 더욱 향상시키기 위해 훈련한 모델은 2024년 국제 정보 올림피아드(IOI)에서 49%의 성과를 기록했다. 모델은 경쟁 프로그래밍 대회(Codeforces)에서도 인간 경쟁자들보다 우수한 성과를 보이며 코딩 실력을 입증했다.

안전성 강화

연쇄적 사고를 통해 모델의 안전성과 정렬 능력도 향상되었다. 모델이 사고하는 과정을 관찰함으로써 인간의 가치와 원칙을 학습할 수 있었으며, 이를 통해 o1-preview는 주요 안전성 평가에서 GPT-4o보다 훨씬 뛰어난 성과를 기록했다.

결론

o1은 AI 추론의 새로운 가능성을 열어준다. 향후 더 개선된 모델을 공개할 계획이며, 이 새로운 추론 능력이 과학, 코딩, 수학 등 다양한 분야에서 AI의 활용 가능성을 크게 확대할 것으로 기대된다. 사용자가 이 모델을 통해 일상 업무에서 어떤 변화를 경험하게 될지 기대된다.

효성, 생산·영업 통합 AI 교육 사례

제조와 영업은 기업 경쟁력의 양대 축입니다. 효성은 생산과 영업을 하나로 묶은 통합 AI 교육을 3회차 진행하며, 두 부문이 공통으로 필요한 AI 역량을 체계적으로 강화했습니다. 정보 검색부터 데이터 분석, 보고서 작성, 맞춤형 AI 도구 제작까지, 실무 전 과정을 AI로 혁신하는 방법을 배웠습니다. 교육 개요 * 교육 대상: 효성 생산·영업 부문 * 교육

삼성전자 MX 사업부, AI 실습 교육으로 시장조사부터 자동화까지 완성

모바일 사업을 선도하는 MX 사업부는 빠른 시장 대응과 혁신적인 콘텐츠 제작이 핵심입니다. 삼성전자 MX 사업부는 2회차에 걸친 AI 교육을 통해 시장 조사부터 멀티미디어 콘텐츠 생성, 업무 자동화까지 AI를 전방위로 활용하는 방법을 습득했습니다. 교육 개요 * 교육 대상: 삼성전자 MX 사업부 * 교육 횟수: 2회차 * 교육 시간: 회차당 7시간 * 교육 특징: 시장조사·멀티미디어

삼성전자, 마케터 특화 AI 교육으로 콘텐츠·퍼포먼스 마케팅 역량 강화

마케팅은 창의성과 데이터 분석이 동시에 요구되는 영역입니다. 삼성전자는 마케터를 위한 AI 교육을 콘텐츠 마케팅과 퍼포먼스 마케팅으로 나눠 4회차 진행하며, 각 영역에 특화된 AI 활용법을 집중적으로 훈련했습니다. 교육 개요 * 교육 대상: 삼성전자 마케터 * 교육 구성: 총 4회차 (콘텐츠 마케팅 2회 + 퍼포먼스 마케팅 2회) * 교육 시간: 회차당 7시간 * 교육 특징: 마케팅 직무

SK네트웍스 6회차 AI 교육 후기

AI 중심 사업형 투자·사업지주회사는 다양한 포트폴리오와 방대한 데이터를 다룹니다. SK네트웍스는 6회차에 걸친 AI 교육을 통해 프롬프트 엔지니어링부터 엑셀 자동화, 코딩 지원, 이미지 제작까지 실무 전반에 AI를 적용하는 방법을 습득했습니다. 교육 개요 * 교육 규모: 총 6회차 * 교육 시간: 회차당 6시간 * 교육 대상: SK네트웍스 임직원 * 교육 특징: 프롬프트부터 이미지 제작까지 실무