MS Designer는 아직 대중적으로 알려지진 않았는데 MS에서 추진하는 또 다른 킬러 프로젝트입니다. 요새 MS가 New Bing 을 시작으로 Bing Image Creator, Loop 등 OpenAI의 기술을 앞세워 매우 공격적인 마케팅을 전개하고 있습니다.
이것들이 아직은 Preview나 베타버전이지만 MS의 막강한 자본력과 기술을 봤을 때 빠른시일내에 서비스의 형태를 갖추게 될 것으로 예상이 됩니다. 필자는 이 IT짭블로그에 포스팅을 할 때 최신 기술에 대해서는 딱히 적극적으로 다루지는 않았습니다. 허나 ChatGPT가 나온 후에는 많이 바뀌게 되었지요. 이것저것 waitlist에 등록하며 유료 구독도 하고 있습니다. MS Designer도 그 중 하나인데요. 지금 시점에서는 Preview 버전이라는 점을 감안해서 볼 필요는 있습니다.
MS Designer가 뭔지 빠르게 설명하자면 Canva 컨셉에 Copilot(GPT)을 붙인 겁니다. 다른 리뷰 영상들을 보니 이미지 생성은 DALLE2를 쓰는 것으로 추정이 됩니다. Canva가 뭔지 모를 수 있는데 국내의 앱 중에는 미리캔버스나 Adobe Express 를 떠올리면 쉬울겁니다. chatGPT + Dalle2 + 미리캔버스? = MS Designer 이렇게 보면 식상한 부분도 있지만 그래서 Preview라는 점을 감안해야 한다고 말했습니다.
미리 말하지만 타이틀은 MS Designer지만 디자이너들이 봤을 때는 아직 그들의 수준에는 미치지 못한다고 합니다. 디자이너를 위한 앱이라기 보다는 일반인들이 간단한 디자인을 AI의 도움으로 빠른 시간에 그럴듯하게 만들 수 있는 앱에 가깝습니다. 지금은 그렇지만... MS가 좀더 진심으로 손을 본다면 그 경쟁자들을 순식간에 뽑아낼 수 있을 것이다 - 라는 추측들을 많이 합니다. 그 이유는 뭔가를 만들어 보면서 이야기 하겠습니다.
MS Designer Preview 버전을 테스트 해보고 싶으면 아래 링크에서 waitlist 를 신청해야 합니다. 저같은 경우 한 2주 정도 걸린 것 같은데요. 점차 확대를 하지 않을까 싶습니다.
https://designer.microsoft.com/
waitlist 가 끝나면 아래와 같은 메일이 오고, Try Designer 버튼을 클릭하면 시작할 수 있습니다.
심플한 UI가 나옵니다. MS Designer는 지금 한글도 지원합니다만, 영어로 prompt를 입력한 것과 비교해서 차이가 큽니다. 아마 디자인을 조합하는 AI라 언어 차이가 좀 있는 것 같습니다. 일단 지금은 영어를 사용하는 것을 권장합니다.
텍스트 박스 안에 만들려는 디자인을 기술하면 됩니다. chatGPT와 비슷하지요.
예를 들어 프롬프트에 커피숍 프로모션 용 인스타 포스트라고 입력해봅니다. MS Designer가 15개의 디자인 초안을 만들어 줍니다. 스스로 이미지와 글자를 조합해서 만드는데 모션그래픽이나 동영상 포스트도 있습니다. 인스타 포스트의 크기를 반영해서 사각형으로 만들어 줍니다.
an instagram post about my coffee shop promotion on May 10
여기서 마음에 드는 디자인을 클릭하고 Customize 버튼을 누르면 오른쪽에 또 다시 디자인을 추천해줍니다. 당연히 텍스트나 레이아웃도 변경할 수 있습니다. 이 정도 기능이라면 Canva나 미리캔버스에서도 보던 내용이니 딱히 놀랄 것은 없겠습니다만, 왼쪽의 메뉴가 진짜입니다.
왼쪽의 Visuals의 Generate는 이미지 생성기입니다. DALLE2 모델로 알고 있는데 waitlist 사용자를 제한해서 그런지 퀄리티가 꽤 높습니다. 해외 유튜버 중에는 일부 이미지는 Midjourney와 비교해도 꿀리지 않는다는 평가도 있었습니다. 이게 DALLE2라고 무조건 Midjourney보다 못하거나 하지는 않습니다. 얼마나 Fine tuning 되어 있느냐 이미지 생성시 GPU의 허용범위에 따라 퀄리티가 달라집니다. 그런면에서 MS Designer 는 레벨이 높은 편입니다.
프롬프트에 커피를 만드는 아름다운 여성이라고 하고 이미지를 생성해봤습니다.
a beautiful lady making coffee
3개의 이미지가 생성되었습니다. 시스템 사정에 따라 3-4개 정도가 생성되는 것 같습니다.
놀라운 건 Remove Background 로 누끼를 따거나 Blur Background 의 블러처리 Filter 등 고급 기능을 바로 적용할 수 있다는 것 입니다. 맘에 안들면 Restore Original 버튼으로 언제나 처음의 이미지로 다시 돌아올 수 있습니다.
이렇게 하면 평범한 이미지로도 단번에 고급의 결과물이 나옵니다. 필자가 위에서 언급하길 이건 디자이너의 앱이 아니라고 했습니다. 일반인이 대충적인 디자인 아이디어를 프롬프트에 써넣으면 꽤 그럴듯한 결과물을 만들어 주는 앱입니다. 전문적인 디자인 분야에서의 사용은 아직까지는 조금 두고볼 일이다는 말이 있지요. 예를 들어 색의 배색이나 레이아웃 배치, 의도 등을 해석하는데는 디자이너에 미치지 못한다는 평가입니다.
하지만 ChatGPT의 예에서 보듯이 그런 부족함이 얼마나 빨리 보완될지도 대략 느낌이 오지요. 생성 AI를 무시하다간 큰코 다칩니다. 이들의 발전 속도는 이전까지와는 차원이 다릅니다. IT구루들 중에는 약간의 과장을 보태서 지난 2023년 3월은 AI의 진보로 따지면 10년 발전이 일주일 동안 이루어졌다고 말하는 이도 있습니다. 현재 AI의 발전과 상업적 도입 속도 너무 빠르기 때문에 이로 인한 부작용을 우려하여 일론 머스크 등 유명 인사들은 AI개발을 6개월만 멈추자고 제안하기도 했습니다.
MS Designer는 Stock 이미지와 동영상도 제공합니다. 아래처럼 커피에 관련된 사진을 추천해주기도 하고 아니면 직접 Search에서 검색할 수도 있습니다. AI 생성 그래픽과 Stock 이미지, 동영상만 갖춰도 많은 것을 할 수 있는데 알아서 추천해주고 최종 결과물까지 만들어 줍니다. 비록 센스는 디자이너 보다 못할지 몰라도 이 정도면 과거 파워포인트에 굴림체로 문서를 만들던 시절에 비하면 엄청난 발전입니다.
중요한 건 아무리 디자인이 안되는 사람이 만들어도 결과물은 평균 이상이 될겁니다. 그리고 지금은 학문으로써 발달이 덜되었지만 분야별 프롬프트 엔지니어링 기술이 발전하면 세계에서 가장 디자인을 못하는 사람이라도 하루안에 AI로 디자인하는 방법을 배울 수 있을 거라 봅니다. 아니면 지금처럼 온라인 커뮤니티에서 종류에 따라 프롬프트 정보를 구해서 복사 붙여넣기 하면 되지요. 이것은 복사 붙여넣기를 해도 매번 결과물이 다릅니다. 저작권 문제나 베끼는 문제까지 해결해준다는 것은 이 기술의 잠재적인 파급효과에 대해 생각하게 합니다.
사실 인터넷에서 뭔가 함부로 할 수 없는 것들이 많은데 그건 대부분 저작권 때문입니다. chatGPT로 만든 블로그는 대체적으로 구글의 SEO상 점수를 후하게 받지는 못하지만 그렇다고 구글이 사람이 쓴 글과 이것들을 제대로 구분하기도 쉽지 않습니다. 향후 몇년간 생성 AI의 블로그, 인스타 게시물, 유튜브 동영상들이 인터넷을 점령하게 될 수 있습니다. 구글의 키워드 검색 알고리즘과 인스타, 페이스북, 유튜브 등의 추천 시스템이 지난 십수년간 만들어놓은 시스템은 AI가 생성하는 콘텐츠에 그렇게 면역력이 없습니다. (필자 개인의 경험적 뇌피셜임)
MS Designer는 현재 MS가 밀고 있는 New Bing이라던가 Image Creator 등과 좀 다른 것을 보여줬습니다. 기능적으로 GPT의 NLP에서 아주 진보된 것은 아닌 것 같습니다. 그러나 따로따로 있던 각 기능들을 조합해서 MS Designer 라는 하나의 상업용 앱에 모아놨을 때 어떤 일이 벌어질지는 상당히 기대도 되지만 한편으로 두렵습니다. 일론 머스크와 AI전문가 1000명이 AI개발 잠정 중단을 주장하는 것도 이런 조합들이 가져올 파급 효과가 100% 긍정적이지 않거나 혹은 이 사회가 받아들일 만큼 시간을 벌어주기 위해서 인지 모르겠습니다.
써보면 알게되는데 이 앱 자체는 크게 매력이 있지는 않습니다. 필자는 여전히 미리캔버스가 더 한국적인 서비스라 많이 쓰고 있습니다. 하지만 이 Designer (AI가 마음대로 만들어 주는)가 Preview 에서 Beta가 되고 정식 출시할 때 쯤 또 한번 산업계를 집을 정도의 잠재력이 있다는 것은 부인하지 어렵습니다. 뭐 디자인 플랫폼의 짤짤한 기능들이야 MS정도의 글로벌 대기업이 다 구현할 수 있지요. 하지만 이것이 Canva나 다른 디자인 플랫폼, 즉 전통(traditional)의 디자인과 다른 점이 뭐냐고 했을 때 핵심 코어가 GPT와 DALLE2라는 것입니다.
MS는 GPT기술을 개발한 OpenAI를 사실상 소유해서 각종 AI모델을 언제라도 MS들의 서비스에 갖다가 붙일 수 있습니다. 이 GPT의 성능에 현재는 생성 AI 분야에서 구글조차 밀리는 것으로 보입니다. 그렇다고 당장 구글이 망하진 않겠지만 이런 MS의 제품들이 갖는 의미를 바보가 아닌 이상 구글도 알고 있을 겁니다. 예를 들어 OpenAI가 개발한 Whisper의 경우 유튜브의 자동 자막 생성 기능보다 월등하다는 것은 일반적으로 알려진 상식입니다. MS는 아직 Whisper에 관련한 프로젝트를 시작하지도 않았습니다.
그럼 몇가지 기능들을 더 소개하고 마치겠습니다.
Templates 기능, 미리캔버스 등에서 많이 봤던 템플릿 기능입니다. AI가 생성한 이미지를 바꿔넣는다거나 레이아웃 추천을 받는다거나 해서 같이 사용하면 됩니다.
My Media 그 동안 생성한 AI 이미지를 재사용할 수 있습니다. 뿐만 아니라 로컬PC나 클라우드에서 이미지를 업로드해서 쓸 수 있습니다.
Text 같은 경우도 적절한 폰트를 추천해줍니다. AI가 폰트까지 생성해주는 건지는 모르겠고 (언젠가 그런 날이 오겠지만) 내용에 적합한 폰트를 적용하여 문구를 만들어 줍니다.
Brand Kit은 일종의 테마입니다. 칼라와 폰트 등을 세트로 맞춰주지요. 우리가 할 일은 클릭클릭 해보면서 마음에 드는 스타일을 선택만하면 됩니다.
완성된 도안은 이미지 파일로 받을 수 있습니다. PNG가 추천되는데 JPEG나 PDF도 가능하구요. 동영상 파일의 경우 MP4 영상 파일로 다운 받을 수 있습니다. 이걸로 쇼츠용 영상을 만드는 것도 가능하겠네요. (오디오만 다른 곳에서 입히면 된다)
해서 여기까지 MS Designer Preview 리뷰를 마칩니다. 그리고 여기의 이미지 생성은 DALLE2나 Bing Image Creator에 비해 횟수 제한도 없고 매개변수는 더 넣지 못하지만 퀄리티가 상당히 준수합니다. 뭐 매개변수라기 보다는 프롬프트를 얼마나 잘 쓰느냐에 따라 퀄리티가 좌우되니까요. Preview 버전의 사용권을 받아서 무한 이미지 생성기로 써도 나쁘지 않을 듯 합니다. 프롬프트의 사용법은 필자도 아직 잘 모르겠습니다. MS Designer는 누가 봐도 언어 모델은 아니고 이미지와 언어 모델 등이 적당히 조합되어 있는 형태입니다. 이것저것 많이 써봐야 프롬프트를 좀 쓸 수 있게 되지 않을까 - 보고 있습니다.
MS Designer를 쓰면 누구라도 그럴듯한 이미지를 만들 수 있고 조금 더 공부하면 좀 더 쓸만한 디자인을 만들 수 있습니다.
OpenAI Whisper 설치하기 / 파이썬 오픈소스 음성인식 AI / Audio to Text / Speech to Text (tistory.com)
파이썬 OpenAI API whisper 사용하기 - 음성 데이터를 텍스트 스크립트로 변환(Speech to Text model) (tistory.com)
깃허브 Copilot 시작하기 - VS Code Copilot 확장 (tistory.com)
MS의 노션 대체 프로그램 Loop 퍼블릭 프리뷰(Public Preview) 리뷰 (tistory.com)
AIPRM으로 SEO 블로그 포스트 생성하기 - ChatGPT 블로그 가이드 2 (tistory.com)
빙 ChatGPT (새로운 Bing) 사용 후기 - MS Bing AI 리뷰 (tistory.com)
Node.js로 OpenAI API 사용법 - ChatGPT 코딩 / GPT-3 Text Completion / GPT-3.5 chatCompletion (tistory.com)
파이썬 OpenAI API 접속하기, text completion create - 파이썬 OpenAI (1) (tistory.com)