애플이 텍스트 명령을 기반으로 사진을 편집할 수 있는 인공지능 모델을 출시한다.

Apple은 현재 AI 게임에서 최고의 플레이어 중 하나는 아니지만 사진 편집을 위한 회사의 새로운 오픈 소스 AI 모델은 해당 분야에 어떤 기여를 할 수 있는지 보여줍니다. 이 모델은 MGIE(MLLM 유도 이미지 편집)라고 하며, MLLM(다중 모드 대형 언어 모델)을 사용하여 이미지를 처리할 때 텍스트 기반 명령을 해석합니다. 즉, 이 도구에는 사용자가 입력하는 텍스트를 기반으로 이미지를 편집하는 기능이 있습니다. 이를 수행할 수 있는 최초의 도구는 아니지만 “인간의 지시는 때로는 기존 방법으로 캡처하고 따르기에는 너무 짧습니다.” 프로젝트 시트 (PDF) 읽어보세요.

이 회사는 캘리포니아 대학교 산타바바라 캠퍼스의 연구원들과 함께 MGIE를 개발했습니다. MLLM은 단순하거나 모호한 텍스트 프롬프트를 이미지 편집기가 직접 따를 수 있는 보다 자세하고 명확한 지침으로 바꾸는 기능을 갖추고 있습니다. 예를 들어, 사용자가 페퍼로니 피자의 이미지를 “건강하게 만들기” 위해 편집하려는 경우 MLLM은 이를 “야채 토핑 추가”로 해석하고 이미지를 편집할 수 있습니다.

MGIE는 이미지를 크게 변경하는 것 외에도 텍스트 프롬프트를 통해 이미지 자르기, 크기 조정 및 회전은 물론 밝기, 대비 및 색상 균형을 향상시킬 수도 있습니다. 또한 이미지의 특정 영역을 수정할 수 있으며, 예를 들어 사진 속 사람의 머리카락, 눈, 옷을 수정하거나 배경의 개체를 제거할 수 있습니다.

좋다 벤처비트 Notes, Apple을 통해 모델 출시 깃허브하지만 관심 있는 사람들은 다음을 시도해 볼 수도 있습니다. 실험적인 현재 Hugging Face Spaces에서 호스팅되고 있습니다. Apple은 이 프로젝트에서 배운 내용을 자사 제품에 통합할 수 있는 도구나 기능에 사용할 계획인지 아직 명확하게 밝히지 않았습니다.

Seung Jae-Hwa

“재화는 뛰어난 분석 능력을 가진 분석가로, 다양한 주제에 대한 깊은 통찰력을 가지고 있습니다. 그는 창조적인 아이디어를 바탕으로 여러 프로젝트를 주도해왔으며, 좀비 문화에 특별한 애정을 갖고 있습니다. 여행을 사랑하며, 대중 문화에 대한 그의 지식은 깊고 폭넓습니다. 알코올에 대한 그의 취향도 독특합니다.”

READ Square Enix는 판매용이 아니며 인수 소문을 불러 일으켰습니다.

애플이 텍스트 명령을 기반으로 사진을 편집할 수 있는 인공지능 모델을 출시한다.

Up next

한국, 젊은 여행객을 위한 스포츠 테마 투어 만든다

Author

Seung Jae-Hwa

답글 남기기 응답 취소

Xiaomi, NVIDIA G-SYNC 기술이 적용된 Mi OLED TV 공개

Dell은 최신 UltraSharp 모니터에 120Hz 패널을 탑재했습니다.

젤다: 왕국의 눈물 파일 크기가 전환될 것으로 보입니다.

Reggie는 당나귀 콩가를 싫어했고 DK 브랜드에 피해를 줄까 걱정했습니다.

일본어 자동 자막 프로그램 추천 및 사용법

코리아 오픈: Emma Raducano는 브리튼이 2024년 남은 계획을 공개하면서 ‘아시아에서 번성’하고 있음을 확인 | 테니스 뉴스

“죽은 인터넷 이론”이 새로운 AI 기반 소셜 미디어 앱으로 다시 살아납니다.

텍사스 대사 대화 – 한미경제연구원

애플이 텍스트 명령을 기반으로 사진을 편집할 수 있는 인공지능 모델을 출시한다.

Up next

Author

Seung Jae-Hwa

답글 남기기 응답 취소

You May Also Like