Bing 이미지 생성기
MS에도 AI 이미지 생성기가 있습니다. 현재 무료로 사용이 가능하고 DALLE 모델을 기반으로 하기 때문에 퀄리티도 준수합니다. OpenAI의 DALL·E기반으로 하는 AI 이미지 생성기로 DALL·E보다 퀄리티가 준수하다는 평이 꽤 많습니다.
Bing 이미지 생성기는 아래 링크를 통해 바로 사용해 볼 수 있습니다. MS 계정으로 로그인 후 사용할 수 있습니다. 엣지 브라우저나 크롬 브라우저 둘다 사용가능합니다.
한번에 4개의 그림을 생성합니다. 로긍인하면 부스터를 25개 주는데 사용자가 많아서 인지 조금 시간이 걸리는 것 같네요. AI이미지 생성도 인내심이 필요합니다. 요새 보면 사진 한장 건질려고 이미지 생성 노가다를 하는 크리에이터들이 많이 늘었습니다. 뭐 요즘은 초기라서 노다지 시장이긴 하더군요. Webui 이미지를 잘 뽑아서 유튜브에 올려 조회수 수백만을 뽑는 것도 봤습니다. 잘만 만들 수 있다면 이것도 상당한 돈벌이가 될 것 같습니다. 그런데 뭔가 허무하긴 하더군요. 진짜 그림 그리는 사람들이 필요없어진건가 생각도 들고... 암튼 이 기술이 어떻게 발전할지 그 방향성이 나와버렸기 때문에 AI때문에 밥을 굶을 사람들이 많을 것 같습니다. 위기의식을 느끼면 얼른 빠져나와서 딴 걸 알아보는 것도 하나의 방법이겠지요.
The romantic atmosphere of the city was perfect for the elegant woman who loved to immerse herself in its charm.
부스트는 주단위로 충전됩니다. 근데 MS계정은 만드는데 제한이 없으니까 한 네개 만들어 놓으면 매주 100개의 부스트를 사용할 수 있는겁니다.
City Pop Style Lady 컨셉으로 만들어 봤습니다. 자세히 보면 얼굴이 괴기스러운데 이는 아직까지 DALLE의 특성입니다. 일반에게 공개한 모델은 조금 정교하지는 않지요. 뭐 가끔 잘 나오기도 하는데 프롬프트가 길어질 수록 힘들어 하는 것 같더군요.
프롬프트는 다음과 같습니다. 아 그리고 bing image creator는 현재 영어만 지원합니다. (Preview 버전이니까 아직 베타도 아니다)
The trendy lady was grooving to the upbeat city pop music at the vibrant concert.
그래피티 스타일의 city pop 입니다. 이건 실사쪽보다 훨 마음에 드네요.
The bold graffiti art style of the city pop scene was glamourous and eye-catching to the lady.
어느 정도의 얼굴 퀄리티를 만들어 낼 수 있나 궁금해서 다음의 프롬프트를 사용해 봤습니다. 역시 상당한 얼굴이네요. DALLE는 특정 단어에 포커스를 맞추면 퀄리티가 급 올라갑니다.
a face of an young pretty lady
동물 사진도 워낙 많이 학습했기 때문에 변형이 쉽습니다. 특히 개는 뭐 자유자재네요.
The dog with sunglasses who is smiling looks like he's ready for some fun in the sun
마구잡이로 넣을 수 있지만 부스트 숫자가 제한되어 있으니까 chatGTP를 사용해서 프롬프트를 만드는게 퀄리티가 좋습니다. 뭐 자신이 있으면 스스로 프롬프트를 만드는 것도 좋습니다. 이것도 AI 생성기를 다루는 사고의 빌드과정이니까 필요한 기술이긴 합니다. 그러나 지금은 좀 더 화려한 이미지를 위한 프롬프트 만드는 팁을 소개합니다.
우선 chatGPT 확장 프로그램인 AIPRM을 설치합니다. AIPRM의 설치는 아래 포스트를 참고합니다.
AIPRM으로 SEO 블로그 포스트 생성하기 - ChatGPT 블로그 가이드 2 (tistory.com)
프롬프트에서 Dall-E / Bing Image - Wording Creator를 찾습니다. Search에서 검색하면 됩니다.
여기에 키워드를 넣으면 조합가능한 형용사, 명사, 동사, 스타일들을 리스트해주고 예시로 20개의 문장을 만들어 줍니다. 20개의 문장을 써도 되고 여기서 단어를 조합해도 됩니다. (근데 이거 영단어 공부같음;;;) 아니면 예시 문장에서 단어만 바꿔주는 것도 하나의 방법입니다. (영어 문제 풀이인줄;;;)
용과 기사(Dragon and knight)라는 단어만 가지고도 아래와 같은 멋진 일러스트를 뽑을 수 있습니다. 이렇게 수채화 같은 스타일이 DALLE 기본 스타일이더군요. 개인적으로 좋아하는 화풍입니다. 어메리칸 RPG 게임의 일러스트같네요. (인디게임같으면 적당히 포샵해서 갖다가 써도될듯)
The brave knight rode his horse towards the dragon with his sword drawn.
생성 이미지에 있어서는 Stable Diffusion Webui 가 디테일에 있어서 더 많은 옵션이 있지만 그건 이제 조금 전문적으로 들어가는 분위기가 보입니다. Blender를 사용한 포즈 생성이라던가 너무 많은 기술이 한꺼번에 쏟아져 나오고 있어서 그래픽적으로 문외한 필자는 잘 못따라가겠더군요. 일반인은 MS Bing Creator를 ChatGPT와 함께 사용하는 것 만으로도 상당히 준수한 퀄리티의 이미지를 뽑을 수 있습니다. 위의 그림들을 보면 이해가 될 겁니다. 어떤 것들은 AI가 생성하는 이미지가 인간의 상상보다 훨 창의적일 때가 있습니다.
*Bing Image Creator도 계속적으로 업그레이드 될 것으로 보이는데 이미 이 정도의 레벨이라니 흥미진진합니다. 2023년3월은 AI 산업계 역사에 있어서 10년이 진보한 기간이라는 평가가 있습니다. 너무 뭐가 빨리 나오고 있는데 열심히 적응하는 사람도 있고 그렇지 않고 그냥 손놓고 보고 있는 사람도 있습니다. 우리 각자의 직업이 뭐든간에 GPT 기반의 기술을 좀 사용해 보는 것도 좋을 것 같습니다.
생성 AI 분야의 뭐든간에 지금 시작하면 얼리 어댑터는 맞아요. 1일 사용자가 몇억명이니 그걸 떠나서 이것도 쓰는 사람만 씁니다. 필자는 AI 전공자는 아니지만 IT짭블로그 고인물로써 지난 2월달 부터 흥미가 많이 생겨서 이것저것 놀아보고(Play) 있는 상태입니다. 지금은 ChatGPT, Copilot, Notion AI 등 마구잡이로 써보고 있는데 이것도 시간이 지나면 누군가가 구글처럼 전국통일 한번 하겠지요. AI에 관한 포스트 때문에 지난 몇년간 연재하던 비트코인 차트도 잠시 쉬고 있습니다. (시장은 이제 막 재미있어 지고 있음) 좀 있으면 비트코인 GPT 스캠한번 나와서 또 세상을 한판 엎어야 뭐가 또 나올지 모르겠네요. 이 블로그를 시작하고 성장시킨 계기가 IT쪽 업계의 다양한 기술이었기 때문에 앞으로도 재미있는 AI 소프트웨어나 이슈를 계속 다룰 생각입니다.