일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Zoom 자막 추출
- 안지워지는이유
- Zoom자막
- LLM
- deepseek
- JAVA EE Integration
- GridSerarchCV
- 하이퍼파라미터최적화
- 유튜브자막 추출
- ChatGPT
- Zoom 영상 자막 다운
- SeSAC
- 딥시크
- RandomSearchCV
- 도봉1기
- randomstate
- 노션 countif
- 개발자도구로 영상자막 다운받는법
- One-Hot encoding
- 도봉1기llm
- Optuna
- 새싹LLM강의
- 나타나지 않을 때
- 영상 자막 추출
- 유튜브자막다운로드
- 테스트데이터
- 유튜브자막 추출하는법
- (도봉 SW 1기) LLM 활용 인공지능 서비스 개발자 양성과정
- hyperparameter-optimization
- Raytune
- Today
- Total
잇연
[AI,GPT] 챗GPT, 빙챗, 코파일러의 공통점과 차이점, 생성AI 본문
https://www.youtube.com/watch?v=Ap2NgyBUANM
https://news.mt.co.kr/mtview.php?no=2023040715415379589
질문 : GPT, 챗GPT, 빙Chat ,코파일럿의 공통점과 차이점
답변 :
메커니즘 측면으로 비교했을 떄, Bing Chat의 기능이 들어가는 것과 마이크로소프트 365에 코파일럿이 들어간 것은 구조적으로는 유사하다.
GPT - 4라는 것은 오픈AI사의 언어 모델이이자, 좀 더 개선된 멀티 모델(텍스트, 이미지, 음성, 영상 등으로 다양하게 컴퓨터와 대화하는 환경)을 지원하는 언어 모델이다.
Bing Chat은 대화형으로 상호작용이 가능한 챗 GPT 기능이 탑재된 대화형 검색엔진 서비스이고,
마이크로소프트365의 코파일러 기능도 이와 비슷하다.
챗GPT가 오피스 문서를 잘알거나 하지 않는다. 기존에 있떤 마이크로소프트 그래프라는 문서에 대한 내용들을 API화 시키고, 잘 검색하고 가져올 수 있는 기능과 GPT-4기반의 언어모델 자체가 결합이 돼서 회사 내 문서들을 초거대언어모델로 같이 썻다는 것이 차이가 있을 뿐이지,
근본적으로는 언어모델(GPT)과 부가적인 서비스들이 결합이 됐다는 점에서 동일하다.
=> GPT = 언어모델, 기반이 되는 기술
=> Chat GPT = GPT+챗봇, 대화형 서비스
=> BingChat = GPT+검색엔진
=> 코파일럿 => GPT+ 오피스 문서의 인터페이싱 기능(워드, 엑셀, 아웃룩 등의 서비스)
질문: 코파일럿은 ChatGPT 기반인가요 GPT 기반인가요?
답변 :
코파일럿은 GPT-4기반이다.
질문 : 코파일럿의 엑셀 기능 중 그래프 해석, 생성 기능은 멀티모달과 관련되나요?
답변 : 멀티모달, 파운데이션 모델이라고도 얘기할 수 있다.
(멀티모달 : 텍스트, 이미지, 영상, 음성 등 다양한 데이터 모달리티를 함께 고려하여 서로의 관계성을 학습 및 표현하는 기술)
그래프 인지하고 생성하고 콘텍스트 이해하는 정도는 기존에도 충분히 가능했던 부분인데, 텍스트 뿐만 아니라 관련있는 이미지와 문구를 작성하는 것들은 멀티모달에 가깝다. GPT가 한번에 처리할 수 있는 토큰(AI가 이해할 수 있는 언어단위)가 크다. 그래서 멀티미디어 생성 측면에서도 유용해서 365에서 GPT-4의 기능을 사용했다고 보면 된다.
일반적으로 멀티모달은 업무에 어디에 써야되는지 감이 오지 않을 수 있는데, 코파일럿은 멀티모달을 업무에 활용하는 효과적인 예시로 보여줄 수 있었다.
질문: 코파일럿은 일하는 방식의 혁신과 변화를 얼마나 가져올까요?
답변 : 가장 중요한 부분은,시간을 많이 돌려드릴 것이다. 생산성의 재정의라고도 할 수 있을텐데. 과거 6시간 걸리던 일을 1시간 정도 줄이는 것과 과거 6시간 걸리던 일을 단 10분 만에 끝내는 것에는 엄청난 차이가 있다. 남는 시간에 어떤일을 더 할 수 있는가 고민해봐야하고, 기존의 업무에 대한 정의를 새롭게 할 필요가 있다. 문서 작성이나 창조, 아이디어는 좋은 인공지능이어도 사람의 창조능력을 따라갈 수 없다. 또한, 기존 데이터기반에 한에서 시간을 줄여주는 것이지 완전한 무에서 유를 만들어내는 기술은 아니다. 오피스365 코파일럿 기능도 결국 사내에 마이크로소프트 365 기반 문서가 있어야 생성이 가능한것이지, 참조할 문서도 없는데 서랍이나 USB안에 문서가 있다면 사실 의미가 없거나 효과가 미미할 수 밖에 없다. 마이크로소프트 365 기반의 원드라이브 비즈니스라든지 공유하고 있는 부분들이 필요하다.
메일같은 부분도 마찬가지. 노트북 하드디스크의 메일을 가져다 참고하는 것이 아니라, 메일 서버에 있는 내용이 연동이 되는것이지, 네트워크가 안되어있는 것을 바탕으로 수집해서 보여주는 것은 절대 아니다.
질문 : 마이크로소프트 365를 많이 사용했을수록 PPT를 자동으로 만들어주는 것도 훨씬 잘 만들어줄 수 있겠군요
답변 : 네. 작년의 제안서나, 지난달 영업실적 보고서 등의 문서가 있어야 비교해서 참조해서 만든느것이지 아무것도 없는 데 만들기 어렵다.
질문 : AI 모델을 만드는데 드는 비용
답변 : 구체적으로 모델 만드는 비용을 정확하게 말씀드리기 어렵다. 데이터 크기에 따라서 다를 수 있기 때문. 기본적인 언어 모델을 만드는데 투입되는 돈이 약 133억원, 그 외 추가적 학습도 계속 비용이 발생된다. 막대한 시간과 비용을 투입해야한다.
질문 : 파인튜닝(사전 훈련된 AI 모델을 특정 작업에 맞게 성능을 개선시키기 위해 훈련시키는 과정)에도 비용과 시간이 많이 드나요?
답변 : 무료는 아닙니다. 마이크로소프트 애저클라우드에서 파인튜닝을 하실 수 있고,시간당 과금이 됩니다. 학습데이터가 얼마나 있느냐에 따라서 그 시간이 결정되고, 시간당 84불로 되어있으니 약 10만원정도이다. 데이터에 따라서 3시간이 걸릴지 , 4시간이 걸릴지는 데이터 양에 따라서 차이가 있을 수 있다.
질문 : 예를 들어 10년동안의 기사를 들고 찾아가서 요청드리면 몇시간 정도 걸릴까요? 대략적으로 수 시간, 수 일, 수주 어느정도 걸릴까요?
답변 : 데이터의 사이즈와 규모에 따라 달라질 수 있다. 몇 시간안에 가능할 것 같습니다.
처음부터 그라운드업해서(밑바닥부터시작) 해서 만든다고 하면 비용과 시간이 많이 들지만 있는 서비스를 가져다쓰면 바로 적용해서 비즈니스 속도를 빠르게 만들 수 있다. 가지고 있는 데이터를 잘 활용하는 것이 목적이지 인공지능
그 회사의 목적이 아니라면 가져다 쓰면 된다. 안타깝게도 국내 기업들은 자체 솔루션 제작만을... 그런 부분들은 생각을 전환하시는 것이 필요하다. 빨리 접목하여 빠르게 빌려쓰는 것이 경쟁력인 시대로 바뀌었다.
질문: 생태계 구성에 신경쓰시는 부분이 있으시다면?
답변 :오래전부터 개발자지원을 가장 높은 우선순위에 두고 일을 해왔다. 새로운 생태계의 시작점이 개발자의 손에서 시작된다고 생각하기 떄문. 개발자분들이 사용할 수 있는 서비스들 개발 도구들, 도큐먼트, 오픈소스 등을 지원합니다.
딥스피드 - 딥러닝 라이브러리오픈소스화해서 공개되어있고, 기술을 이용해서 시간을 단축하거나, AI전문가나 언어모델을 만드는 사람도 아니여도 MS 생태계에서 AI 서비스 개발을 쉽게할 수 있도록 지원합니다.
오픈AI 스튜디오라는 걸 클라우드 상에서 제공하고 있고, 플레이그라운드에서 프롬프트를 만들어본다던지 그 결과를 본다던지 이런걸 개발자분들이 미리 테스트해볼 수 있는 플레이그라운드를 지원하고 있다.
질문 : 국내 회사중 마이리얼트*, 굿*, 삼*삼 등과 같은 곳에서 챗GPT 가지고 와서 자사 서비스에서 적용을 했더라구요.
그렇게 가져와서 쓰는 거소가 애저에서 쓰는 것과 차이점이 있나요?
답변 : 오픈AI사도 애저와 마찬가지로 API형태로 AI 서비스를 제공하고 있습니다. 첫번째로는 보안에 대한 부분들이 있고,
그 다음에 우리 회사 사내 시스템과 연동이 되느냐 그러면 버추얼 네트워크, 회사 내부망 연결 등의 기능들이 제공되어야 한다. 또한 SLA라고 Service Level Agreement(서비스 제공자와 고객 간의 서비스 품질, 범위, 보상범위 등을 정의하고 합의한 계약서) 신뢰수준 보장을 해야하는데 애저를 이용하면 99%의 가용성을 보장받습니다. Responsible AI(AI가 믿을 수 있는 정보를 제공하도록 설계하는것), 갑자기 욕설을 한다던지 기업이 의도하지 않은 말을 한다던지 할 때 문제가 되는데 Responsible AI 기능도 마이크로소프트 챗 GPT에는 포함되어있다. 일반적인 AI를 API형태로 가입해서 쓰실 수도 있지만
기업이라면 보안, 법률 준수, 가용성 Responsible AI와 같은 기능들을 활용하기 위해서는 기업용 클라우드 를 제공하는 회사의 서비스를 쓸 수 밖에 없다.
질문 : 고객의 데이터를 클라우드로 옮겨서 AI 모델을 학습한다던가 데이터 유출에 대한 걱정을 가지시는 분들도 있는데 ..
답변 : 고객의 데이터는 고객 소유이고, 고객이 ChatGPT에 질문을 했다고 해서 해당 질문 내용으로 모델 개선을 하지 않는다. 저희가 학습용 데이터와 추론 프롬포트용 데이터를 구분할 수 있는데, 만약에 학습을 파인튜닝했다 했을 땐 고객이 데이터를 가지고 있고, 삭제까지 할 수 있는 기능을 제공하고 있다. 고객의 데이터에 함부로 접근할 수 없다.