Catalog Integration Made Easy

  • Published on
    31-Dec-2015

  • View
    27

  • Download
    0

DESCRIPTION

Catalog Integration Made Easy. P.J. Marrn, G. Lausen und M. Weber Universitt Freiburg. eCatalogs sind die Grundlage des eBusiness. Gewnscht sind integrierte Kataloge. diese funktionieren aber derzeit noch nicht zufriedenstellend: Physische Integration hat Nachteile, - PowerPoint PPT Presentation

Transcript

  • Catalog Integration Made EasyP.J. Marrn, G. Lausen und M. WeberUniversitt Freiburg

  • Integration elektronischer KatalogeeCatalogs sind die Grundlage des eBusiness.Gewnscht sind integrierte Kataloge. diese funktionieren aber derzeit noch nicht zufriedenstellend:Physische Integration hat Nachteile,Logische Integration ebenso.Schn wre eine Integration (fast) ohne Aufwand.

    das genau kann eine adaptive Auswertung leisten.

  • lokaler Katalog globaler KatalogproductsjammernamepricecompanydepartmentpricemobileproductpersonelcomputingAnfrage: /department/mobile//jammer/price ?

  • bersichtAdaptive Auswertung von XPathXPathXPath Subanfrage-TransformationenBewertung von TransformationenIntegration elektronischer KatalogArchitekturExperimenteZusammenfassung

  • (i) XPathFr das Resultat res(Q) der Query Q gilt:res(Q) = Ln(Cn) = Cn+1.

    Der Ausgabe-Kontext einer Subquery ist induktiv definiert zu: C1 = root, Ci+1 = Li(Ci), 1

  • (ii) XPath Subanfrage-Transformation ABCACACDBCBangenommene Dokumentenstruktur:tatschliche Struktur:"eliminate""generalize""eliminate""generalizeand eliminate"/A/C/A//B/C/A/C/A//BAnfrage: /A/B/CTransformationTransformationTransformation

  • (ii) Subanfrage Transformation:

    No transformation (n): verarbeite Subanfrage unverndert,Subquery generalization (g): ndern der Achse:child descendentparent ancestorSubquery elimination (e): bergehe die Subanfrage.

  • (iii) Bewertung von TransformationenSei qi = (Ci, Li, Ci+1 ).Anwendung der 3 Transformationsregeln "keine Transformation", "Generalisierung", und "Eliminierung" ergibt 3 Versionen von qi mit den entsprechenden Ausgabe-Kontexten NCi+1, GCi+1, ECi+1.

    Somit:Ci+1 = NCi+1 U GCi+1 U ECi+1.

    Bewertung der Antworten in Ci+1 mittels einer Fitness-Funktion in Abhngigkeit der angewandten Transformationsregel und der bereits berechneten Bewertung des Eingabe-Kontextes Ci.

  • Verwendete Fitness-FunktionJeder Knoten n erhlt einen Fitnesswert vn.Sei Ci der aktuelle Eingabe-Kontext. Sei n Ci und Ci+1= NCi+1 U GCi+1 U ECi+1. Sei m Ci+1.vm ist das Maximum von:wenn m NCi+1 , dann vm = b2 + vn.wenn m GCi+1 , dann vm = b + vn.wenn m ECi+1, dann vm = 1 + vn.Und b = 10.

  • Rechtfertigung der Fitness-FunktionWir mssen Worte aus {n, g, e}* bewerten.

    Intuitiv sollte n >> g, n >> e sein. Jedoch warum g >> e?

    Formal knnen wir auf den Worten eine gewnschte Ordnung definieren und die Fitness Funktion entsprechend definieren (sofern unsere Ordnung konsistent mit n >> g, n >> e ist).

  • Beispiel einer Ordnung:

    eee < perm{g,e,e} < perm{e,g,g} < ggg < perm{e,e,n} < perm{e,n,g} < perm{g,g,n} < perm{e,n,n} < perm{n,n,g} < nnn

    Seien e, g, n die entsprechenden Fitnessbewertungen.Dann knnen sie berechnet werden wie folgt:3e < 2e+g; n > g 2e+g < e+2g; g > e n-3g+2e > 02n+g g, g > e, n qlg + (ql - 1) e > 0, wobei ql Lnge der Anfrage.n=5, g=2, e=1

  • II. Integration elektronischer Katalogeglobal catalog SchemaGlocal catalogL2local catalogL1local catalogL3Q(G)Q(G)Q(G)Q(G)R(L3)R(L1,L2,L3)R(L1)R(L2)

  • Anfragen an den globalen KatalogAnfragen an einen lokalen KatalogFehlerraten (in %) beiKataloge:

  • III. ZusammenfassungXPath ist die derzeit am intensivsten studierte Anfragesprache fr XML.Eine adaptive Auswertung von XPath ist praktisch gut motivierbar.Qualitt der adaptiver Auswertung empirisch belegt.Verschiedene Mglichkeiten zur Verbesserungen des Verfahrens definiert und implementiert.Adaptive Auswertungstechnik verspricht eine effiziente und skalierbare Integration elektronischer Kataloge.

Recommended

View more >