Entsperren Sie die Digest Lock des Editors kostenlos
Der FT -Editor Roula Khalaf wählt Ihre Lieblingsgeschichten in diesem wöchentlichen Newsletter aus.
Mark Zuckerberg baut in diesem Jahr die Audiofunktionen von Meta auf, da der Social -Media -Riese seine Pläne zur Erzielung von Einnahmen aus sich schnell entwickelnden Technologien steigt.
Meta plant, LLAMA 4, dem in den kommenden Wochen erwarteten groß angelegten Sprachmodell erwartet, verbesserte Sprachfunktionen einzuführen.
Das Unternehmen konzentriert sich besonders darauf, die Konversation zwischen Benutzern und ihren Sprachmodellen näher an einem wechselseitigen, natürlichen Dialog zu führen, um Unterbrechungen von Benutzern zu ermöglichen, anstatt ein strengeres Fragen- und Antwortformat, sagte einer.
Der Push of Voice kommt, als CEO Zuckerberg seinen kühnen Plan umrundet, um die 1,7-Tonnen-Firma Silicon Valley zu einem „KI-Führer“ zu machen. 2025 wird als Make -up für 2025 -KI -Produkte bezeichnet oder ein Jahr lang ein Break -Jahr, um die Technologie im Wettbewerb mit Konkurrenten wie OpenAI, Microsoft, Google zu kommerzialisieren.
Dies hat das Unternehmen dazu veranlasst, KI -Assistent in Meta AI Premium -Abonnements für Agentenaufgaben wie Buchungsreservierungen und Videoerstellung auszuprobieren. Sie erwägen auch, bezahlte Anzeigen oder gesponserte Beiträge in Suchergebnissen der KI -Assistenten einzuführen, sagte einer der Personen.
In diesem Jahr gab Zuckerberg Pläne für den Bau eines KI-Ingenieurwesens mit Codierungs- und Problemlösungsfunktionen auf dem mittleren Ingenieur auf.
Meta lehnte eine Stellungnahme ab.
Chris Cox, der Chief Product Officer der Gruppe, hob am Mittwoch einige der Lama 4 -Pläne hervor und sagte: „Die Rede wird ein“ Omni -Modell „, das einheimisch wird. . . Anstatt den Audio in Text zu übersetzen, den Text an LLM zu senden, den Text zu veröffentlichen oder ihn an die Rede zurückzugeben.
Auf der Morgan Stanley Technology, Media & Telecom Conference, fügte er hinzu: Ich denke, wir sind immer noch in den Sinn gekommen, wie mächtig es ist. ”
Meta diskutiert auch Leitplanken darüber, was die neuesten Lama -Modelle ausgeben können und ob sie senken sollen, und die beiden Personen sind mit dem Problem vertraut.
Die Debatte erfolgt inmitten eines Starts eines Rivalen und einer Anklage wegen Warnungen von David Sachs vom neu ernannten „I Tser“.
OpenAI hat letztes Jahr den Sprachmodus veröffentlicht und konzentriert sich auf die Bereitstellung eines unverwechselbaren Charakters, aber GROK 3, das von XAI von Elon Musk erstellt und auf der X -Plattform verfügbar ist, hat die Sprachfunktion später im letzten Monat zur Auswahl von Benutzern eingeführt.
Das GROK -Modell wurde speziell für weniger Leitplanken ausgelegt, einschließlich „unbemerkter Modus“, der laut dem Unternehmen absichtlich auf eine Weise reagiert, die „unangenehm, unangemessen und beleidigend“ sein soll.
Das letztjährige Meta veröffentlichte eine „heilige“ Version des KI -Modells der dritten Lama -Iteration, nachdem er kritisiert hatte, dass Lama 2 sich weigerte, unschuldige Fragen zu beantworten.
Benutzer zu ermöglichen, mit KI -Assistenten mit Sprachbefehlen zu interagieren, ist eine wichtige Funktion der Ray Bans Smart Brille von Meta und kürzlich bei den Verbrauchern ein großer Erfolg. Die Gruppe beschleunigte ihre Pläne, ein leichtes Headset zu erstellen, das Smartphones als Haupt -Computergeräte der Verbraucher wegnehmen kann.
Zusätzliche Berichte von Melissa Heckilla aus London