PA153 Počítačové zpracování přirozeného jazyka 10 - Promluva, znalosti nebo snad domněnky? Karel Pala, Zuzana Nevěřilová Centrum ZPJ, Fl MU, Brno 2. prosince 2013 Karel Pala, Zuzana Nevěřilová PA153 Zpracování přirozeného jazyka 10 - Promluva, znalosti 1/22 Q Význam promluvy Q Prostředky koherence Q Promluvové objekty Q Znalosti Q Belief-Desire-Intention Karel Pala, Zuzana Nevěřilová PA153 Zpracování přirozeného jazyka 10 - Promluva, znalosti 2/22 Význam promluvy • část slova 9 sloVO • slovní spojení • fráze a věta, souvětí • koherentní (souvislý) text Karel Pala, Zuzana NevěTilová PA153 Zpracování přirozeného jazyka Význam promluvy Psí granule a kafe. • Co si přejete? • Co se to tady vysypalo? o Co máte nejraději? • Cos dnes jedl? • Co po tobě ten pes chtěl? • Co po tobě ten člověk chtěl? • Co po tobě ten člověk mrštil? Karel Pala, Zuzana Nevěřilová PA153 Zpracování přirozeného jazyka 10 - Promluva, znalosti 4/22 Analýza promluvy: krabicový model A: Už jsi ten motor smontoval? - Provleč lano tím okem na horní straně motoru. - Jo, mimochodem, koupils už ten benzín? B: Jasně, koupil, když jsem sháněl disk do sekačky. - Zapomněl jsem vzít kanystr, tak jsem koupil nový. A: Byl drahý? B: Ne, ale bude se mi hodit do auta. A: Fajn. - Už to máš provlečené? Prostředky koherence o časová souslednost (jednota času, místa a děje) o porušení časové souslednosti je vyjádřeno explicitně: , Ještě předtím • výrazy jako „Nejprve ..., potom ... „Oproti tomu ... „také" • elipsa: Koupila jsem si auto a Marie [si koupila auto] taky. Karel Pala, Zuzana Nevěřilová PA153 Zpracování přirozeného jazyka Elipsa, výpustka (ellipsis) o Petr šel na večírek, kde [Petr] potkal Pavlu. • Koupila jsem si auto a Marie [si koupila auto] taky. • Mám zavolat já tobě, nebo ty [máš zavolat] mně? • [Mám vám dát na ty brambory] máslo? • Nevím proč [bych měla tuhle knížku číst]. Karel Pala, Zuzana Nevěřilová PA153 Zpracování přirozeného jazyka 10 - Promluva, znalosti 7/22 Promluvové objekty seznam objektů promluvy (promluvový objekt, PO; discourse entity): • množina prvků znalostní báze (knowledge base, KB), které byly zmíněny a mohou být odkazovány pomocí zájmen 9 pokud prvek nebyl zmíněn, a přesto může být odkazován, byl evokován jmenná fráze typicky vyjadřuje nějaký PO Karlovi/ někdo ukradl autoy, kteréy [on]/ měl zaparkované před domem^. [on]/ Zavolal na policii/, [oni]/ přijeli, [oni]/ sepsali tom. Za měsíc mu/ [oni]/ napsali, že [oni]/ případm odkládají. Karel Pala, Zuzana Nevěřilová PA153 Zpracování přirozeného jazyka 10 - Promluva, znalosti 8/22 Odkazy v diskurzu: druhy anafor exofora (odkaz mimo text) Co je to? endofora (odkaz do textu) v takovém prípade anafora (zpětný odkaz) - antecedent (dříve evokovaný PO) Anežka na sebe hodila kabát a vyrazila, katafora (dopředný odkaz) Protože [on] byl chytrý, vydal se David nejprve za svým šéfem, koreference: Václav Klaus, Klaus, bývalý prezident, on, čórlpero druhy anafor: 9 deixe: Petr si ukrojil chleba a pak ho snědl. • synonymum: Petr si ukrojil chleba a pak krajíc snědl. • hyperonymum: Petr si ukrojil chleba a pak jídlo snědl. 10 - Promluva, znal Rozpoznaní anafor, rezoluce anafor (anaphora resolution, AR): základní algoritmus O objekty promluvy (PO): promluvový zásobník (history list) Q při každé zmínce objektu se PO posune na vrchol zásobníku O každý odkaz se nahradí PO, který je nejblíž vrcholu zásobníku a obsahuje gram. shodu (číslo, příp. rod) O v jedné klauzi se PO vyskytuje jen jednou Karlovi někdo ukradl auto, které [on] měl zaparkované před domem, [on] Zavolal na policii, [oni] přijeli, [oni] sepsali to. Za měsíc mu [oni] napsali, že [oni] případ odkládají. případ? Karel? dům? policie ? Karel? dům? policie_ Karel Pala, Zuzana Nevěřilová PA153 Zpracování přirozeného jazyka 10 - Promluva, znalosti 10 / 22 Promluvové objekty a znalost světa Karlovi/ někdo ukradl autoy, kteréy [on]/ měl zaparkované před domem^. [on]/ Zavolal na policii/, [oni]/ přijeli, [oni]/ sepsali tom. Za měsíc mu/ [oni]/ napsali, že [oni]/ případ/ odkládají. Jak poznáme, že tom =případm? Jak poznáme, že [oni]/ =policie? Potřebujeme znalost o světě. Karel Pala, Zuzana Nevěřilová PA153 Zpracování přirozeného jazyka 10 - Promluva, znalosti 11 / 22 Znalosti a odvozování • znalosti o jazyce (lexikon, gramatické kategorie, syntax) • znalosti o světě Znalostní báze (knowledge base, KB): obsahuje fakta, která jsou premisami v deduktivním odvozování lidmi čitelné KB: how-to, FAQ, recepty, návody, diagramy strojově čitelné KB: ontológie (S U M O-MILO), sémantické sítě (WordNet), dbPedia, ConceptNet Znalost: deklarativní a procedurální Karel Pala, Zuzana Nevěřilová PA153 Zpracování přirozeného jazyka 10 - Promluva, znalosti 12 / Deduktivní odvozování: monotónní a nemonotónní odvozování [Allen, 1995] KB: Ptáci létají. Vrabec je pták. Pštros je pták. Pštros nelétá. Vrabec létá. Pštros létá. Pštros létá. Karel Pala, Zuzana Nevěřilová PA153 Zpracování přirozeného jazyka 10 - Promluva, znalosti 13 / 22 Common sense a odvozování common sense: sdílená znalost, ne vždy v souladu s (vědeckými) fakty (V noci nesvítí slunce.) Cheap apartments are rare. Rare things are expensive. Cheap apartments are expensive. Deduktivní odvozování není možné použít vždy (ve skutečnosti skoro nikdy). Karel Pala, Zuzana Nevěřilová PA153 Zpracování přirozeného jazyka 10 - Promluva, znalosti 14 / 22 Common sense: nejznámější projekty • CyC: vývoj od r. 1985(1), reprezentace pomocí vlastního jazyka CyCL, mikroteorie • OpenMind: přirozený jazyk, crowdsourcing • ConceptNet: syntaktická analýza OpenMind, propojení s Wiktionary • Never-ending Language Learning (NELL): prochází web a odvozuje, občas lidský zásah ("I deleted my Internet cookies", "I deleted my files" =4> soubor je stejná kategorie jako pečivo) Karel Pala, Zuzana Nevěřilová PA153 Zpracování přirozeného jazyka 10 - Promluva, znalosti 15 / 22 Common sense a parafráze Parafráze: promluva x je parafrází promluvy y, pokud x a y mají stejný nebo podobný význam. Tento most postavila Nejlepší firma s.r.o. Nejlepší firma s.r.o. postavila tento most. Stavitelem tohoto mostu je Nejlepší firma s.r.o. Základní způsoby parafrázování: • aktivní-pasivní větná konstrukce: Tento most byl postaven Nejlepší firmou s.r.o. • synonyma: Tuto lávku postavila Nejlepší firma s.r.o. o hyperonyma: Tuto stavbu postavila Nejlepší firma s.r.o. o substantivizace, deverbalizace: Stavitelem tohoto mostu je Nejlepší firma s.r.o. • kombinace: Tento most byl vytvořen Nejlepší firmou s.r.o. Karel Pala, Zuzana Nevěřilová PA153 Zpracování přirozeného jazyka Odvozování, parafrázování: využití 9 odpovídání na otázky • chatbots • automatická sumarizace textu • ... Karel Pala, Zuzana Nevěřilová PA153 Zpracování přirozeného jazyka Znalost nebo domněnka? KB: Ptáci létají. Vrabec je pták. Pštros je pták. Pštros nelétá. Mrtvý vrabec nelétá. Znalostní báze se mění. Některé znalosti mají poměrně krátké trvání (Nejsem unavená. Je půl druhé.) V umělé inteligenci se používá termín domněnka (belief) [Marik et al., 2001]. 10 - Promluva, znalosti Umělá inteligence: modely uvažování inteligentních agentů Intencionálni systém: agent umí „uvažovat" o svých znalostech. Je schopen přemýšlet o svých přáních a jak jich lze dosáhnout [Mařík et al., 2001]. Mentální postoje: 9 informační postoje - znalosti, fakta získaná senzory o proaktivní postoje - cíle, plány, závazky Psychologické modely lidského uvažování [Bratman, 1987]: kognitivní stavy, afektivní stavy, konnativní stavy. Domněnka-přání-záměr: softwarový model pro aktivní inteligentní agenty Karel Pala, Zuzana Nevěřilová PA153 Zpracování přirozeného jazyka 10 - Promluva, znalosti 19 / 22 Umělá inteligence: belief-desire-intention Záměr, Intention Aby bylo možné vytvořit aktivního agenta, je třeba, aby ,,věděl, co chce" (intention). Pokud ví, co chce (tj. má záměr), vytvoří si agent nějaký plán (lokální cíl). Příklad: najdi cestu z domu X na Fl Int a (f) agent si vybírá vždy cesty tak, aby na nich někdy platila (f) Přání, Desire Přání vyjadřuje agentovu motivaci. Motivovaný agent má cíle (cílové stavy). Cíle by neměly být v rozporu. Příklad: najdi nej kratší cestu z domu X na Fl Des a (f) pravdivost formule 0 je cílem agenta a Belief, Domněnka Domněnka představuje agentovu bázi znalostí. Informace mohou být pravdivé, agent v ně v daný okamžik věří a chápe je jako nedokonalé přiblížení obrazu okolního světa [Mařík et al., 2001]. Příklad: najdi nej kratší cestu z domu na Fl. Mostecká je neprůjezdná. Bel a (f) agent a věří v pravdivost formule (f) Karel Pala, Zuzana Nevěřilová PA153 Zpracování přirozeného jazyka 10 - Promluva, znalosti 20 / 22 Odkazy I Allen, J. (1995). Natural Language Understanding (2nd ed.). Benjamin-Cummings Publishing Co., Inc., Redwood City, CA, USA Bratman, M. (1987). Intention, plans, and practical reason. Harvard University Press. Marik, V., Štěpánková, O., and Lažanský, J. (2001). Umělá inteligence. Number zv. 3 in Umělá inteligence. Academia. Pease, A. (2011). Ontology: A Practical Guide. Articulate Software Press. Karel Pala, Zuzana Nevěřilová PA153 Zpracování přirozeného jazyka 10 - Promluva, znalosti 21 / 22 Odkazy II Schank, R. C. and Abelson, R. P. (1977). Scripts, Plans, Goals, and Understanding: An Inquiry Into Human Knowledge Structures (Artificial Intelligence). Lawrence Erlbaum Associates, 1 edition. Published: Hardcover. Smith, B. (1995). Formal ontology, common sense and cognitive science. International Journal of Human-Computer Studies, pages 641-667 Wasserman, K. (1985). Physical object representation and generalization: A survey of programs for semantic-based natural language processing. Al Magazine, 5(4):28-42. Karel Pala, Zuzana Nevěřilová PA153 Zpracování přirozeného jazyka 10 - Promluva, znalosti 22 / 22