Apple은 6월 WWDC에서 iOS 18의 데뷔를 앞두고 대규모 오픈 소스 언어 모델 세트를 출시했습니다. Apple은 OpenELM이라고 부르는 이러한 요소를 다음과 같이 설명합니다. 열림-원천 시간능률 에게언어 오델.

테스트에서 Apple은 OpenELM이 다른 개방형 언어 모델과 유사한 성능을 제공하지만 교육 데이터가 더 적다고 밝혔습니다.

애플은 다음과 같이 설명합니다.

이를 위해 우리는 진화하는 개방형 언어 모델인 OpenELM을 출시했습니다. OpenELM은 레이어 스케일링 전략을 사용하여 변환기 모델의 각 레이어 내에 매개변수를 효율적으로 할당함으로써 정확성을 향상시킵니다. 예를 들어, 약 10억 개의 매개변수로 구성된 매개변수 예산을 사용하는 OpenELM은 OLMo에 비해 정확도가 2.36% 향상되는 동시에 필요한 사전 훈련 토큰이 2배 더 적습니다.

모델 가중치, 추론 코드, 비공개 데이터세트에 대한 사전 훈련만 제공하는 이전 관행에서 벗어나, 우리 버전에는 훈련 로그, 다중 체크포인트 및 사전 학습을 포함하여 공개적으로 사용 가능한 데이터세트에서 언어 모델을 훈련하고 평가하기 위한 완전한 프레임워크가 포함되어 있습니다. 포인트들. 훈련 구성. 또한 Apple 장치에서 추론 및 미세 조정을 위해 모델을 MLX 라이브러리로 변환하는 코드도 출시합니다. 이 포괄적인 릴리스는 개방형 연구 커뮤니티에 권한을 부여하고 강화하여 미래의 개방형 연구 노력을 위한 길을 닦는 것을 목표로 합니다.

아래 링크에서 자세한 내용을 확인할 수 있습니다.

iOS 18에는 다양한 새로운 AI 기능이 포함될 예정이며, 오늘 출시된 OpenELM은 Apple이 이면에서 진행 중인 최신 작업에 불과합니다.

블룸버그 지난 주 저는 iOS 18의 AI 기능이 기기 전체의 대규모 언어 모델에 의해 구동되어 개인 정보 보호 및 속도 이점을 제공할 것이라고 보고했습니다.

기회를 따르세요: 스레드, 트위터, 인스 타 그램그리고 마스토돈.

FTC: 우리는 수입을 얻기 위해 자동 제휴 링크를 사용합니다. 더.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

You May Also Like

Google 메시지는 iMessage 반응을 이모티콘으로 표시합니다.

최신 Google 메시지 업데이트는 혼합 그룹 채팅에서 자주 나타나는 성가신 iMessage 반응…

Microsoft, Games Showcase에서 ‘Doom’이라는 제목의 완전 디지털 Xbox 콘솔 공개

(로이터) – 마이크로소프트는 일요일 엑스박스 시리즈의 새로운 디지털 버전을 공개하면서 연례 엑스박스…

Lenovo의 최신 2-in-1은 Windows와 Android를 하나의 장치로 결합합니다.

완벽한 2-in-1 노트북을 발견하는 데 가까워졌지만 아직까지 거기에 도달한 회사는 없습니다. Lenovo의…

Meta Quest 3: Zuckerberg, 하이브리드 가상 현실 헤드셋 공개

뉴욕 CNN — Meta는 새롭고 향상된 기술로 AR 세상을 장악하기 위해 노력하고…