본문 바로가기
ChatGPT 탐구 및 원리

ChatGPT (쳇GPT) 넌 어떻게 번역을 잘하니? 탐구(3)

by 후니호호 2023. 3. 22.
반응형

안녕하세요 후니호호 입니다. ChatGPT를 탐구하는 내용을 시리즈로 작성중 입니다 ^^

 

ChatGPT(챗GPT) 설치? 넌 누구니? 탐구 (1)

ChatGPT (챗 GPT) 설치? 넌 누구니? 첫 만남. 2022년 겨울 터덜터덜 꼭꼭 아침밥을 먹으며 핸드폰을 보다가 뉴스에 신기한걸 보게되었다. Chatgpt? 이건 뭐지? 질문을 하면 대답을 해준다고? 음... 그전에

hunihoho.tistory.com

 

 

ChatGPT(챗GPT) 어떻게 그렇게 대답을 잘하니? 탐구 (2)

안녕하세요~ 후니호호 입니다. ChatGPT(챗GPT) 설치? 넌 누구니? 탐구 (1) ChatGPT (챗 GPT) 설치? 넌 누구니? 첫 만남. 2022년 겨울 터덜터덜 꼭꼭 아침밥을 먹으며 핸드폰을 보다가 뉴스에 신기한걸 보게

hunihoho.tistory.com

 

오늘 탐구와 원리 3탄! ChatGPT의 번역 과정을 알아보고자 합니다!

 

지난 시간에는 저희가 GPT가 무엇이고 어떤 식으로 대답하게 되는지 알아 보았는데요.

 

이번 시간에는 번역하는 원리를 알아 보도록 하겠습니다.

사람이 하는 번역

사람이 하는 번역의 단계는?

  • 이해: 번역자는 번역하려는 문서를 읽고 이해하는 단계입니다. 이때 번역자는 문장의 구조, 어휘, 문맥 등을 파악하여 원문의 의미를 정확히 이해해야 합니다.
  • 번역: 번역자는 이해한 내용을 기반으로 번역을 수행합니다. 이때 번역자는 문장 구조와 어휘를 적절히 조합하여 번역합니다. 번역 과정에서는 문장 구조나 단어 선택에 따라서 번역문의 의미가 바뀔 수 있기 때문에, 번역자는 항상 원문의 의미를 유지하면서 번역을 해야 합니다.
  • 검수: 번역이 완료되면, 다른 번역자나 검수자가 번역을 검수합니다. 이때 검수자는 번역문의 문법, 맞춤법, 의역 등을 검토하여 원문의 의미를 올바르게 전달하는지 확인합니다.
  • 교정: 번역문이 검수를 거친 후에는 번역자가 검수자의 지적을 받아들이고 수정하는 단계입니다. 이때 번역자는 번역문의 문장 구조나 어휘를 수정하여 더욱 원문에 가까운 번역을 완성합니다.

네 사람이 하는 언어의 번역은 다음과 같은 과정을 거치는데요.

그러면 우리가 쓰는 구글 번역이나 파파고 같은 번역은 어떻게 번역을 할까요?


번역

기존에 사용하던 번역 방법 "통계 기반 번역"

통계 기반 기계 번역은 대부분의 기계 번역 시스템이 사용한 과거 방식으로, 단어와 구문 등의 정보를 수집하여 확률 분포를 추정하고, 그 분포를 기반으로 번역 결과를 도출하는 방식입니다.

 

예를 들어, 영어에서 한국어로 "I love you"라는 문장을 번역하고자 한다면, 통계 기반 기계 번역 모델은 다음과 같은 과정을 거칩니다.

  • 병렬 말뭉치 수집: 영어-한국어 병렬 말뭉치(둘 이상의 언어에서 문장이 대응되는 쌍)를 수집합니다                           예를 들어, "I love you"와 "나는 너를 사랑해"와 같은 문장 쌍을 수집합니다.
  • 언어 모델 학습: 영어 문장과 한국어 문장을 분석하여 각각의 언어에 대한 확률 분포를 추정하는 언어 모델을 학습합니다.
  • 번역 모델 학습: 언어 모델을 기반으로, 영어 문장의 단어와 구조 등의 정보를 수집하여 한국어 문장의 단어 및 구조 정보를 추정하는 번역 모델을 학습합니다.
  • 번역 문장 생성: 영어에서 한국어로 번역하고자 하는 "I love you"라는 입력 문장을 번역 모델에 입력하여, "나는 너를 사랑해"와 같은 한국어 문장을 생성합니다.

위와 같은 과정을 통해 통계 기반 기계 번역 모델은 입력 문장과 출력 문장 간의 확률 분포를 기반으로 번역을 수행합니다.

 

이 방식은 데이터 양이 많아질수록 정확도가 향상되며, 단어나 구문 등의 정보를 확률 분포로 추정하는 방식이기 때문에 어순이나 단어 선택 등의 문제를 일정 수준 이상 해결할 수 있습니다. 그러나 이 방식은 문장 전체의 문맥과 의미를 파악하지 못하는 경우가 있어, 정확도가 떨어지는 경우가 있습니다.


자 그럼 ChatGPT는 어떤 방법으로 번역을 할까요?

ChatGPT의 번역 방법 "Neural machine translation"

뉴우럴 머신 트랜슬래이션! 멋지다 GPT!

 

Neural machine translation은 입력 문장과 출력 문장을 모두 벡터 공간상으로 매핑하는 인공 신경망 기반의 기계 번역 방식입니다. 이는 기존의 통계 기반 기계 번역 방식보다 더욱 정확한 번역 결과를 도출할 수 있는 방식으로, 현재 많은 번역 서비스에서 활용되고 있습니다. (벡터는 지난 시간에 이야기했쬬?^^)

 

인공지능 번역

예를 들어, 영어에서 한국어로 "I love you"라는 문장을 번역하고자 한다면, neural machine translation 모델은 다음과 같은 과정을 거칩니다.

 

  • 입력 문장을 토큰화: "I love you"를 단어 단위로 쪼개어 "I", "love", "you"라는 세 개의 토큰으로 분리합니다.
  • 단어 벡터화: 각각의 토큰을 고정된 크기의 벡터로 표현합니다. 예를 들어, "I"는 [0.1, 0.3, -0.2, ...]와 같은 벡터로 표현됩니다.
  • 인코더: 입력 문장의 벡터 표현을 생성하는 인코더 네트워크를 통과시킵니다. 이를 통해 입력 문장의 의미를 담은 고차원 벡터가 생성됩니다.
  • 디코더: 생성된 벡터를 디코더 네트워크에 입력하여, 번역된 문장의 단어 벡터를 생성합니다.
  • 출력 문장 생성: 디코더에서 생성된 단어 벡터를 다시 단어로 디코딩하여, 번역된 문장을 생성합니다. 이 경우, "I love you"를 한국어로 번역하면 "나는 너를 사랑해"와 같은 문장이 생성될 수 있습니다.

위와 같은 과정을 통해 neural machine translation 모델은 입력 문장과 출력 문장을 고차원 벡터로 매핑하고,

 

이를 통해 번역을 수행합니다. 이러한 방식은 통계 기반 기계 번역보다 문장의 문맥과 의미를 더욱 정확하게 파악할 수 있으며, 다양한 언어 간의 번역을 수행할 수 있습니다.


후니호호 였습니다!! 다음 탐구 시간에 찾아오도록 하겠습니다.

 

 

 

ChatGPT (쳇GPT) 사용법, 번역 기능 써봤습니다!

ChatGPT(챗GPT) 사용법, 욕을 해보았다. 안녕하세요 후니호호 입니다. ChatGPT (챗 GPT) 설치? 넌 누구니? 첫 만남. 2022년 겨울 터덜터덜 꼭꼭 아침밥을 먹으며 핸드폰을 보다가 뉴스에 신기한걸 보게되

hunihoho.tistory.com

 

반응형

댓글