Mi az a ReALM?

A ReALM a “Referenciák Feloldása Mint Nyelvi Modellezés” rövidítése, egy forradalmi megoldás, amelyet az Apple kutatói fejlesztettek ki. Ez egy új nyelvi modell (Nagy Nyelvi Modell, LLM), amely a referenciák felismerésének problémáját a nyelvi modellezés területén végzett feladatként kezeli.

A ReALM hatékonyan alakítja át a különböző típusú kontextusokat szöveges reprezentációvá, amelyet nyelvi feladat részeként dolgoz fel. Ez magában foglalhatja:

  • beszélgetések – például szöveges üzenetek, hangparancsok egy asszisztensnek, vagy e-mailek,
  • elemek a képernyőn – például fényképek, naptár, időjárás widget, vagy a háttérben futó alkalmazások és folyamatok.

Mi különbözteti meg a ReALM-ot más referenciafelismerő modellektől? Először is, a megközelítés – a képfeldolgozás helyett a ReALM a szövegterületen működik. Ez sokkal könnyebbé és hatékonyabbá teszi, ami lehetővé teszi, hogy közvetlenül mobil eszközökön fusson, miközben megőrzi a felhasználói adatokat.

Miben jobb a ReALM, mint a GPT-4?

Az Apple kutatócsapata a ReALM-ot a piacon elérhető legnagyobb teljesítményű nyelvi modellekhez – az OpenAI GPT-3.5 és GPT-4-hez – hasonlította. Az eredmények lenyűgözőek voltak. A referenciafelismerési feladatokban a legkisebb ReALM változat olyan pontosságot ért el, amely összehasonlítható a GPT-4-gyel! A nagyobb ReALM modellek még a GPT-4-et is felülmúlták a képernyőn megjelenő elemekre való hivatkozások felismerésében (http://arxiv.org/abs/2403.20329).

Mi magyarázza ezt az előnyt? Először is, a ReALM kiválóan kezeli a domain-specifikus lekérdezéseket, például az okosotthon eszközökkel kapcsolatosakat. Ennek az az oka, hogy a ReALM mélyebb megértést mutat a kontextusról, mivel a modellt domain-specifikus adatokra finomhangolják.

Továbbá, ellentétben a GPT-4-gyel, amely elsősorban valós tárgyak képein képez, a ReALM kiemelkedik a szöveges elemek és az alkalmazás felhasználói felületeinek komponenseinek felismerésében. És az interfész megértése kulcsfontosságú a hangasszisztensek zökkenőmentes interakciójához a ma használt alkalmazásokkal.

ReALM

Forrás: DALL·E 3, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Ez a valóban intelligens asszisztensek korszakának kezdete?

Valóban, a ReALM integrációja a Siri-vel egy teljesen új fejezetet nyithat a humán-számítógép interakcióban. A ReALM-mal a Siri képes lesz megérteni azokat a parancsokat, amelyek hivatkozásokat tartalmaznak a okostelefon képernyőjén megjelenő elemekre, valamint a háttérben futó folyamatokra és alkalmazásokra. De mikor lesz ez a lehetőség elérhető a felhasználók számára? Ez még ismeretlen.

Csak a modell technikai képességein alapuló spekulációkkal maradunk. Hogyan működhetne egy ReALM-alapú Siri? Például, ha egy üzleti listázó oldalon böngészel, és látsz egy céget, amely érdekel, egyszerűen mondhatod a Sirinek: “Hívd ezt a céget,” és az asszisztens – a ReALM segítségével a kontextus elemzésében – megtalálja a megadott cég telefonszámát, és kezdeményezi a hívást. Még azt sem kell pontosan elmagyaráznod, hogy melyik cégről van szó.

A ReALM lehetőségeinek csak a kezdeténél tartunk. Az olyan parancsok, mint a “Játssza le az utolsó lejátszási listát”, lehetővé tennék a multimédiás alkalmazások és az okosotthon eszközök intuitív vezérlését. A ReALM lehetővé tenné a Siri számára a beszélgetések és a parancsok történetének kontextusának megértését is, így az asszisztens megfelelően reagálna a felhasználó korábbi kéréseire. Ez egy lépés az intelligens ügynökök felé, közelebb hozva minket nemcsak egy olyan mesterséges intelligenciához, amely megérti a kéréseinket, hanem egy olyanhoz is, amely tudja, hogyan kell végrehajtani a parancsokat.

És ez csak a ReALM által nyújtott lehetőségek kezdete. Az olyan parancsok, mint a “játssza le az utolsó lejátszási listát”, lehetővé tennék a multimédiás alkalmazások és az okosotthon eszközök intuitív vezérlését. A ReALM lehetővé tenné a Siri számára a beszélgetések és a parancsok történetének kontextusának megértését is, így az asszisztens megfelelően reagálna a felhasználó korábbi kéréseire. Ez egy lépés az intelligens ügynökök felé, közelebb hozva minket nemcsak egy olyan mesterséges intelligenciához, amely megérti a kéréseinket, hanem egy olyanhoz is, amely tudja, hogyan kell végrehajtani a parancsokat.

Sajnos az Android eszközök felhasználóinak várniuk kell. Jelenleg nincs információ a Google terveiről, hogy a Gemini képességeit hozzáadja a Google Asszisztenshez. Egy Google Gemini alkalmazás Android eszközökre készült (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US), de ez még nem elérhető az Egyesült Államokon kívül.

ReALM

Forrás: Google Play (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US)

Összefoglalás

A ReALM az Apple innovatív megközelítése a hangasszisztensek kontextusfelismerési problémájának megoldására. A képfeldolgozás helyett ez a nyelvi modell különböző típusú kontextusokat alakít át szöveges reprezentációvá, amelyet nyelvi feladatban dolgoz fel. Ez a megközelítés nemcsak a magas felismerési pontosságot biztosítja, hanem lehetővé teszi a mobil eszközökön való működést is, miközben megőrzi a felhasználói adatokat.

A Siri ReALM-hoz való hozzáférése természetesebb és kontextuálisabb hanginterakciókat biztosíthat, ami fontos lépés a valóban intelligens asszisztensek felé. A ReALM-mal a Siri azonnal reagálni tud a képernyőn megjelenő elemekkel, alkalmazásokkal és háttérfolyamatokkal kapcsolatos parancsokra. Egy dolog biztos – a segítők kontextuális tudatosságának javítása kulcsfontosságú a valóban intelligens és természetes hanginterakciók létrehozásához, és a ReALM kétségtelenül fontos lépés ebbe az irányba.

ReALM

Ha tetszik a tartalmunk, csatlakozz a nyüzsgő méheink közösségéhez a Facebookon, Twitteren, LinkedIn-en, Instagramon, YouTube-on, Pinterest-en, TikTok-on.

Robert Whitney

JavaScript szakértő és oktató, aki IT osztályokat mentorál. Fő célja, hogy növelje a csapat termelékenységét azáltal, hogy megtanítja másoknak, hogyan működjenek együtt hatékonyan a kódolás során.

View all posts →

AI in business:

  1. 6 nagyszerű ChatGTP bővítmény, amelyek megkönnyítik az életed
  2. Új üzleti lehetőségek feltérképezése a ChatGPT-4 segítségével
  3. 3 lenyűgöző AI író, amit ma ki kell próbálnod
  4. Szintetikus színészek. A 3 legjobb AI videógenerátor
  5. Mik a gyengeségei az üzleti ötletemnek? Egy ötletbörze a ChatGPT-vel
  6. A ChatGPT használata az üzletben
  7. Új, mesterséges intelligenciával működő szolgáltatások és termékek
  8. Automatizált közösségi média bejegyzések
  9. A közösségi média bejegyzések ütemezése. Hogyan segíthet az AI?
  10. A mesterséges intelligencia szerepe az üzleti döntéshozatalban
  11. A vállalati NLP ma és holnap
  12. AI-segített szöveges chatbotok
  13. AI alkalmazások az üzletben - áttekintés
  14. A mesterséges intelligencia fenyegetései és lehetőségei az üzleti életben (2. rész)
  15. Az AI fenyegetései és lehetőségei az üzletben (1. rész)
  16. Mi a mesterséges intelligencia jövője a McKinsey Global Institute szerint?
  17. Mesterséges intelligencia az üzletben - Bevezetés
  18. Mi az NLP, vagyis a természetes nyelvfeldolgozás az üzletben
  19. Google Fordító vs DeepL. 5 alkalmazás a gépi fordításra az üzleti életben
  20. Automatikus dokumentumfeldolgozás
  21. A hangrobotok működése és üzleti alkalmazásai
  22. Virtuális asszisztens technológia, vagy hogyan beszéljünk az AI-val?
  23. Mi az üzleti intelligencia?
  24. Hogyan segíthet a mesterséges intelligencia a BPM-ben?
  25. A mai és holnapi kreatív mesterséges intelligencia
  26. Mesterséges intelligencia a tartalomkezelésben
  27. Az AI erejének felfedezése a zenealkotásban
  28. 3 hasznos AI grafikai tervező eszköz. Generatív AI az üzletben
  29. MI és a közösségi média – mit mondanak rólunk?
  30. Vajon a mesterséges intelligencia helyettesíti a vállalati elemzőket?
  31. AI eszközök a menedzser számára
  32. A jövő munkaerőpiaca és a közelgő szakmák
  33. RPA és API-k egy digitális vállalatban
  34. Új interakciók. Hogyan változtatja meg a mesterséges intelligencia a készülékek működtetésének módját?
  35. Multimodális mesterséges intelligencia és annak alkalmazásai az üzleti életben
  36. Mesterséges intelligencia és a környezet. 3 AI megoldás, hogy segítsen fenntartható üzletet építeni.
  37. AI tartalomdetektorok. Érdemesek rájuk?
  38. ChatGPT vs Bard vs Bing. Melyik AI csevegőrobot vezeti a versenyt?
  39. A chatbot AI versenytársa a Google keresésnek?
  40. Hatékony ChatGPT kérdések HR és toborzás számára
  41. A prompt mérnökség. Mit csinál egy prompt mérnök?
  42. MI és mi még? A legfontosabb technológiai trendek az üzlet számára 2024-ben
  43. MI és üzleti etika. Miért érdemes etikus megoldásokba fektetni?
  44. Meta AI. Mit érdemes tudni a Facebook és az Instagram AI-támogatott funkcióiról?
  45. AI szabályozás. Mit kell tudnod vállalkozóként?
  46. 5 új felhasználási mód az AI számára az üzletben
  47. AI termékek és projektek - miben különböznek másoktól?
  48. AI mint szakértő a csapatodban
  49. AI csapat vs. szerepek megosztása
  50. Hogyan válasszunk karrierterületet az AI-ban?
  51. AI a HR-ben: Hogyan befolyásolja a toborzási automatizálás a HR-t és a csapatfejlesztést
  52. AI-vezérelt folyamatautomatikus. Hol kezdjük?
  53. 2023 legérdekesebb 6 AI eszköze
  54. Mi a cég mesterséges intelligencia érettségi elemzése?
  55. AI a B2B személyre szabásához
  56. ChatGPT felhasználási esetek. 18 példa arra, hogyan javíthatja vállalkozását a ChatGPT segítségével 2024-ben
  57. AI Mockup generátor. A 4 legjobb eszköz
  58. Mikrotanulás. Gyors módja az új készségek elsajátításának.
  59. A 2024-es év legérdekesebb mesterséges intelligencia alkalmazásai a vállalatoknál
  60. Milyen kihívásokat jelent az AI projekt?
  61. A 2024-es év legjobb 8 AI eszköze az üzleti életben
  62. AI a CRM-ben. Mit változtat az AI a CRM eszközökben?
  63. Az EU AI Törvény. Hogyan szabályozza Európa a mesterséges intelligencia használatát
  64. A 7 legjobb AI weboldalépítő
  65. No-code eszközök és AI újítások
  66. Mennyivel növeli a mesterséges intelligencia a csapatod termelékenységét?
  67. Hogyan használjuk a ChatGTP-t piackutatásra?
  68. Hogyan lehet szélesíteni az AI marketingkampányod elérését?
  69. Mesterséges intelligencia a szállításban és logisztikában
  70. Milyen üzleti problémákat tud megoldani a mesterséges intelligencia?
  71. Hogyan illeszted össze az AI megoldást egy üzleti problémával?
  72. Mesterséges intelligencia a médiában
  73. AI a banki és pénzügyi szektorban. Stripe, Monzo és Grab
  74. A mesterséges intelligencia az utazási iparban
  75. Hogyan segíti az AI az új technológiák születését
  76. AI a kereskedelemben. A globális vezetők áttekintése
  77. A 4 legjobb AI képkészítő eszköz
  78. A legjobb 5 AI eszköz az adatelemzéshez
  79. A mesterséges intelligencia forradalma a közösségi médiában
  80. Mindig megéri mesterséges intelligenciát hozzáadni a termékfejlesztési folyamathoz?
  81. 6 legnagyobb üzleti hiba, amit az AI okozott
  82. AI stratégia a vállalatodban - hogyan építsd fel?
  83. A legjobb AI tanfolyamok – 6 fantasztikus ajánlás
  84. A közösségi média figyelés optimalizálása AI eszközökkel
  85. IoT + AI, avagy hogyan csökkentsük az energia költségeket egy vállalatnál
  86. AI a logisztikában. 5 legjobb eszköz
  87. GPT Bolt – a legérdekesebb GPT-k áttekintése az üzleti életben
  88. LLM, GPT, RAG... Mit jelentenek az AI rövidítések?
  89. AI robotok – a jövő vagy a jelen az üzletben?
  90. Mennyi a költsége az AI bevezetésének egy vállalatnál?
  91. Mit csinálnak a mesterséges intelligencia szakértők?
  92. Hogyan segíthet a mesterséges intelligencia egy szabadúszó karrierjében?
  93. A munka automatizálása és a termelékenység növelése. Útmutató az AI-hoz szabadúszók számára
  94. AI a startupok számára – legjobb eszközök
  95. Weboldal építése mesterséges intelligenciával
  96. Eleven Labs és mi más? A legígéretesebb AI startupok
  97. OpenAI, Midjourney, Anthropic, Hugging Face. Ki kicsoda az AI világában?
  98. A szintetikus adatok és azok fontossága az üzleted fejlesztésében
  99. A legjobb AI keresőmotorok. Hol keressünk AI eszközöket?
  100. Videó AI. A legújabb AI videógenerátorok
  101. AI a menedzsereknek. Hogyan teheti könnyebbé a munkáját az AI
  102. Mi újság a Google Gemini-ben? Minden, amit tudni érdemes.
  103. Mesterséges intelligencia Lengyelországban. Cégek, találkozók és konferenciák
  104. AI naptár. Hogyan optimalizáld az idődet egy cégnél?
  105. MI és a munka jövője. Hogyan készítsük fel vállalkozásunkat a változásra?
  106. AI hangklónozás az üzlet számára. Hogyan lehet személyre szabott hangüzeneteket létrehozni mesterséges intelligenciával?
  107. "Mindannyian fejlesztők vagyunk." Hogyan segíthetnek a polgári fejlesztők a vállalatának?
  108. Tényellenőrzés és AI hallucinációk
  109. AI a toborzásban – toborzási anyagok lépésről lépésre történő kidolgozása
  110. Sora. Hogyan fogják a valósághű videók az OpenAI-tól megváltoztatni az üzletet?
  111. Midjourney v6. Innovációk az AI képgenerálásban
  112. MI a KKV-kban. Hogyan versenyezhetnek a KKV-k a nagyvállalatokkal az MI segítségével?
  113. Hogyan változtatja meg a mesterséges intelligencia az influenszer marketinget?
  114. Valóban fenyegetést jelent a mesterséges intelligencia a fejlesztők számára? Devin és a Microsoft AutoDev
  115. A legjobb AI chatbotok az e-kereskedelemhez. Platformok
  116. AI chatbotok az e-kereskedelemben. Esettanulmányok
  117. Hogyan maradjunk naprakészen az AI világában zajló eseményekkel kapcsolatban?
  118. Az AI megfékezése. Hogyan tegyük meg az első lépéseket az AI alkalmazásához az üzletünkben?
  119. Zavarodottság, Bing Copilot vagy You.com? Mesterséges intelligencia keresőmotorok összehasonlítása
  120. Lengyelországban működő mesterséges intelligencia szakértők
  121. ReALM. Egy úttörő nyelvi modell az Apple-től?
  122. Google Genie — egy generatív AI modell, amely képekből teljesen interaktív világokat hoz létre
  123. Automatizálás vagy kiegészítés? Két megközelítés az AI-ban egy vállalatnál
  124. LLMOps, avagy hogyan lehet hatékonyan kezelni a nyelvi modelleket egy szervezetben
  125. AI videógenerálás. Új horizontok a videótartalom előállításában a vállalkozások számára
  126. A legjobb AI átirati eszközök. Hogyan alakíthatjuk át a hosszú felvételeket tömör összefoglalókká?
  127. A sentiment-analízis mesterséges intelligenciával. Hogyan segít ez a változások előmozdításában az üzletben?
  128. A mesterséges intelligencia szerepe a tartalommoderálásban