본문 바로가기

공부/AI

[해커톤] 포텐데이 x 네이버 클로바 스튜디오 : 고민에 대한 답을 시로 써주는 <곰곰시인> AI 서비스 개발

 

🍀 비사이드 포텐데이 해커톤 후기, 네이버 하이퍼클로바 X 기반 AI 서비스 개발

지난 12월 10일~19일까지 열흘동안 포텐데이 x 클로바 스튜디오 해커톤에 참여했다.
정말 재미있게 참여했고 우리 팀원들과 사용자의 고민에 시 또는 N행시로 답변해주는 <곰곰시인>이라는 AI 서비스를 기획, 개발 및 배포하였다. 
벌써 한달이 넘게 지났는데 뒷북 후기를 작성해본다. 
 

 

📌 프로젝트 깃허브, 노션 및 배포 링크

프로젝트 깃허브 : https://github.com/potenday-project/GomGomPoet
프로젝트 노션 : https://shell-allosaurus-876.notion.site/8c60e6d4f5654fc0a11f272428a6f581
 
⭐ 프로젝트 링크 : https://gomgom-poet.co.kr/
(혹시 체험해보고 싶으신 분이 계시다면 위 링크를 눌러서 고민을 입력해주세요! 그리고 서비스에 대한 피드백은 언제나 환영입니다🙋‍♀️)
 
 

📌 비사이드 포텐데이 x 클로바 스튜디오 해커톤 소개

비사이드 포텐데이 x 클로바 스튜디오 해커톤의 취지는 네이버클라우드 초대규모 AI 하이퍼 클로바X 기반의 차별화된 AI 기반의 서비스 프로토타입을 직접 기획하고 개발까지 해보는 것이었다. 그리고 이 해커톤에 참여해야겠다고 동기부여를 받은 점은 크게 3가지였다.
첫째, 현재 기준으로 기업 사용자 위주로 클로즈베타 신청이 가능한 클로바 스튜디오를 개인 사용자로서 직접 써볼 수 있다는게 큰 메리트라는 생각이 들었다. 게다가 해커톤에 참여하면 90만원 상당의 네이버 클라우드 크레딧도 제공받을 수 있었다.
둘째, 일반적인 해커톤은 하루 이틀동안 밤새면서 진행되는데 이 해커톤은 열흘동안 진행되어 일정에 무리 없이 여유있게 참여할 수 있다는 점이 좋았다. (하지만 결국 제출 마감일에 밤을 새긴 했다..ㅎㅎ)
셋째, 그냥 재밌어 보였다! 난 그동안 해커톤 경험도 없고 그동안 AI 대회는 대부분 혼자 참여했었기 때문에 팀 프로젝트로 새로운 걸 해보고 싶어서 도전해보았다.
 
 

📌 팀 빌딩

해커톤에 참여할 때에는 기획, 개발, 디자인으로 나눠서 지원할 수 있었다. 나는 회사에서 같은 팀원 분들과 함께 팀 빌딩을 하여 참여하였다. 이 때 해커톤에서 지칭하는 개발 업무는 웹(백엔드, 프론트엔드)에 해당했다. 그래서 AI 직무(프롬프트 엔지니어링)에 해당하는 나는 원래 기획자가 아니지만 이번 해커톤에서는 기획으로 지원을 했다. 
 
 

📌 해커톤 아이디어 디벨롭


✔ 하이퍼 클로바의 강점은?

우선 아이디어를 정하기 전에 네이버의 LLM을 써보면서 네이버의 자연어 AI 모델에는 어떤 강점이 있나를 가장 먼저 살펴보았다. 동일한 프롬프트를 GPT-4와 하이퍼 클로바 X에 동시에 사용해보면서 비교해봤는데 '사실적이거나 전문적인 텍스트'를 생성하는 건 GPT-4가 더 잘했다. 그래서 내가 실제 사용자라면 뭔가를 분석하거나 전문적인 도메인의 지식을 얻는 태스크를 작업할 때 하이퍼 클로바 X보다는 GPT-4를 사용할 것 같다라는 느낌.. 
하지만 하이퍼 클로바 X의 강점도 있었다. 다양한 태스크로 실험을 해보니 하이퍼 클로바 X는 일상적이거나 예술적인 텍스트(시, 대화, 편지 등)의 한국어의 문체를 chatGPT보다 자연스럽게 써준다는 장점을 발견했다. 그래서 네이버 LLM의 강점을 적극 활용할 수 있는 분야의 서비스를 기획하기로 큰 방향을 정했다. 

✔ 아이디어 구체화하기

하이퍼 클로바 X의 강점도 활용할 수 있으면서, 간단하고 재미있는 서비스를 만들고 싶었다. 그에 따라 우리 팀은 ‘사용자의 고민에 대한 답변을 시 또는 N행시로 써주는 AI 서비스’를 기획하게 되었다. 이미 시중에 고민에 대해서 전문적이고 서술식의 상담 서비스는 많지만, 고민에 대한 접근방식을 재미있고 예술적인 차원에서 풀어나가볼 수 있도록 한다면 사용자들에게 새롭게 다가갈 수 있지 않을까? 라는 생각에서 출발하였다.  
 
 

📌 곰곰시인 컨셉 확정


우리 팀에서는 사용자의 고민에 대한 답을 시로 써주는 서비스라는 점을 각인할 수 있도록, 고민이라는 단어를 곰으로 줄인 곰곰시인으로 서비스명을 정하고 ‘시로 풀어내는 나만의 고민 친구’라는 페르소나를 곰곰시인에게 부여하기로 했다. 그래서 ‘곰곰시인의 캐릭터를 친근하게 만들어보자’라는 목표도 설정하고 그림도 그려보았다.
 
러프 버전의 곰곰시인... ㅎ 

 
 
최종 완성 곰곰시인
(사족이지만 이걸 그리면서 디자이너의 필요성을 절감했다.. 이외에도 어떤 폰트를 쓸지, 폰트 크기와 간격부터 색상 정하는 것까지.. 직접해보니 사소한 것 하나하나 다 어려운 작업이었다. 디자이너 분들 리스펙!)

 
 

📌 곰곰시인 서비스 핵심기능 고안

 
일단 구현 전에 핵심 기능 및 서비스 플로우를 이렇게 기획했다. (너무 대충 그려서 창피하지만 그냥 올리기...)

주기능은 사용자로부터 고민을 입력받고 이에 대한 답변을 시 또는 N행시, 그리고 편지로 작성해주는 것이었다. 여기에 더불어 SNS 공유용 이미지 생성사이트 내에서 자랑하기 페이지에 공유할 수 있는 부기능도 덧붙이기로 했다.
 
 

📌 곰곰시인 최종 완성

 
팀원 분들이 모두 열심히 작업해주신 덕분에 곰곰시인을 무사히 최종 완성하여 제출하였다.
해커톤에 제출했던 곰곰시인 소개서는 다음과 같다. 

 
참고로 지금은 자랑하기 기능을 없앴다. 그 대신 공유하기 기능을 활성화하였다. 기존에는 시나 N행시 결과를 이미지로 저장하는 '이미지 공유하기' 기능만 있었는데 전체 페이지를 한꺼번에 공유할 수 있는 'URL 공유하기' 기능도 추가하여 원하는 SNS에 공유하거나 개인적으로 결과 페이지 링크를 소장할 수 있게끔 하였다. 
 
그리고 우리 팀에 투표한 다른 팀원 분들의 코멘트를 보았는데 좋은 피드백을 해주셔서 감쟈합니다..🙌

 
 

📌 해커톤 후 느낀 점 

 

✔ 다른 팀원들의 업무 이해도가 높아졌다

일단 회사에서 같은 팀원 분들과 참여했는데 우리는 같은 팀이지만 웹 직무와 AI 직무가 나뉘어 있어서 서로의 업무에 대해 살펴볼 기회가 많이 없었지만 이번 기회로 웹 개발자 분들의 업무에 대해 더 자세히 알게 되고 이해도가 높아져서 좋았다. 그리고 능력있고 좋은 팀원 분들 덕분에 원하는 기능들이 정말 빠르고 정확하게 구현되어서 리스펙 👍
 

✔ 클로바 스튜디오를 체험해볼 수 있었다는 것이 좋았다

아직 개인 사용자에게 오픈되지 않은 네이버의 클로바 스튜디오를 써보는 것이 좋은 경험이었다. 간단하게 네이버 클로바 스튜디오에 대해 느낀 점을 써보자면 다음과 같다.
 
플레이 그라운드 
플레이 그라운드에서 일반 모드는 기존 언어모델들(LK-B, LK-C, LK-D2 )을 사용해서 텍스트를 생성하고, 챗 모드는 HyperCLOVA X 모델을 사용해서 텍스트를 생성하는 모드이다. 
플레이 그라운드에서 좋았던 점은, 내가 모델을 통해 작업한 것(프롬프트나 하이퍼 파라미터 등)을 저장해둘 수 있었다. 그래서 프롬프트 테스트를 하면서 좋았던 설정들은 이렇게 저장해두었다.

그리고 네이버에서 기본적으로 제공해주는 샘플 작업들도 있어서 비슷한 작업을 한다면 해당 샘플들을 불러와서 사용하면 편할 것 같았다. 

전반적으로 처음 써보는 사람도 비교적 쉽게 사용할 수 있게끔 직관적으로 구성되어 있었다.
 
튜닝
튜닝은 총 7개의 작업 종류와 직접 호출하여 학습할 수 있는 API가 제공된다.

튜닝 API를 사용하면 하이퍼 클로바 X 엔진인 HCX-002 엔진을 튜닝할 수 있고 클로바 스튜디오 작업에서는  LK-B, LK-C, LK-D2 엔진을 튜닝해볼 수 있었다. 그런데 올해 1월 25일 HCX-003 엔진이 새롭게 출시되면서 LE-C, LK-C, LK-D, HCX-002 모델의 신규 이용은 불가하다고 한다. (공지사항 : https://www.ncloud-forums.com/topic/134/) 
일단 해커톤에 참여하는 동안은 튜닝 API는 사용하지 않았고 클로바 스튜디오의 작업 중 문장 생성, 문체 전환 튜닝을 사용해봤는데, LK-B, LK-C, LK-D2 엔진을 튜닝해볼 수 있었다. 모델 크기는 LK-B < LK-C < LK-D2 순이었고 우리는 LK-D2 엔진을 사용했다. 시 데이터를 수집해서 시 문체를 학습하도록 튜닝을 해봤는데, 생각보다 튜닝 결과가 원하는 결과와 달랐다. 해커톤을 진행하는 동안엔 시간이 없어서 결국 튜닝을 더이상 진행하지 않고 프롬프트 엔지니어링만으로 사용자 고민에 대한 시와 N행시를 생성하도록 설정해두었다. 
다음에 시간이 된다면 튜닝 API를 사용해서 챗에 특화된 HCX 엔진을 직접 튜닝해보거나, 데이터셋 instruction 구성을 좀  다르게 하거나 데이터셋의 크기를 좀 더 늘려서 학습해보거나 하는 식으로 시도해보고 싶다.
클로바 스튜디오의 튜닝 기능은 직관적으로 다양한 작업을 제공해주고, 학습 전에 예상 사용 토큰도 계산해주어서, 처음 써보는 입장에서도 쉽게 사용하기 좋았던 것 같다. 다만 튜닝 진행 상황이 실시간으로 퍼센티지로 보이지가 않아서 아쉬운 점도 있었다.
 

✔ 오프라인 모각코(모여서 각자 코딩)를 할 수 있어서 좋았다

12월 16일에 네이버 클라우드에서 오프라인 모각코가 있었다. 

 
런치 박스도 주시고 네이버 클라우드 로고가 각인된 텀블러와 파우치도 주셨다. (심플한 블랙 예뻐요) 그리고 집에 갈 때 런치 박스가 많이 남아서 추가적으로 더 챙겨주셔서 감사했다. 모각코에 참여해본 것도 처음이라서 재미있는 경험이었다.
 

✔ 곰곰시인 서비스화

해커톤이 끝났지만, 우리 팀에서는 곰곰시인을 서비스화하기로 했다. 거창하게 해보려는 건 아니고 그냥 뭐든 시도해보는 건 재미있으니까 한번 해보기로! 그래서 지금 가비아에서 도메인도 사고 DB도 바꾸고 프롬프트도 추가적으로 더 실험하고 여유 시간에 모델 튜닝도 새롭게 더 진행해서 성능을 업 해보려고 한다.
 
아무튼 이 글을 끝까지 읽어주신 분들, 2024년 새해복 많이 받으시고 곰곰시인에도 많관부,, 🙇‍♀️ 
다시 한번 남겨보는 링크 : https://gomgom-poet.co.kr/  

반응형