Fragen zu DIS
2004-08-31 12:33
Slater
machen anscheinend wenig die Prüfung, aber versuchen kann mans ja ;) :
Kopplung zu Anwendungen:
was ist der Unterschied zwischen SQL-Einbettung und Integriere Sprache/ Spracherweiterung?
ist letzteres gleich dem Konzept 'Relationale Anwendungsprogrammierschnittstellen (API)'?
oder was ist nun wieder der Unterschied zu den APIs?
was ist denn die Mehrsprachenfähigkeit bei den APIs?
gibt es das Cursor-Konzept nur bei den APIs oder wo noch
(die Beispiele sind alle in 'exec sql' = SQL-Einbettung?
obwohl doch nur für APIs gedacht?
-> was ist der Unterschied zwischen SQL-Einbettung <-> APIs <-> Integriere Sprache/ Spracherweiterung?)
-> ist das Cursor-Konzept der einzige Unterschied zwischen Satzverarbeitung hin zu 'Mengenorientierung'?
———
TA-Konzept, Konsistenzebene 0:
wieso sollten kurze Schreibsperren Lost Update verhindern könnnen?
—–
Data Warehouse:
Data cube: was ist denn der Unterschied zwischen normalisierten Stern und Schneeflocke?
Level-Stern:
wozu die Level-ID?,
sehe ich das richtig das hier neben den Dimensionstabellen auch
die Faktentabelle mehrfach gespeichert wird, auf jedem Granularitätslevel?
—–
Data Mining:
Dimensionalitätsreduzierung:
Minimum Subset Selection:
inwiefern werden da subsets gebildet?,
zum Beispiel bei den angegebenen Beispiel mit X,Y,C, was ist da das subset?
Klassifikation:
bootstrapping, was heißt das auf deutsch/ wie geht das?
den Zusammhang z.B. zu
http://www.websters-online-dictionary.org/definition/english/bo/bootstrap.html
sehe ich nicht so ;)
edit
ah, ist da doch vorhanden unter Statistik, aber auch nicht so endgültig erklärt..
Klassifikation-Evaluierung:
sind FAR/ FRR entsprechend das gleiche wie V und R aus Document Retrieval-Kapitel?
falls sie nicht übereinstimmen: was bedeuten sie dann und wieso gibts da einen Trade Off?
was sind p(true), p(false), wieso ist e_max = min (p(false),p(true)),
was soll diese 'maximale Fehlerrate' aussagen?
Clustering:
lokales Clustering Kriterium MND:
ist MND vom Clustering abhänging?, wenn ja wieso?,
ist das nicht immer gleich, die Datenpunkte ändern sich doch nicht,
-> wie ändern sich die MND-Werte?
wenn sich MND ändert
(vielleicht gehen nur die Punkte des aktuellen Clusters ins Ranking ein?):
gibt es einen Trade Off zwischen MND und globalen Kriterium oder streben beide in die gleiche Richtung?
——-
ein Link zu Data Mining:
www.icaen.uiowa.edu/~comp/Public/Kantardzic.pdf
Kopplung zu Anwendungen:
was ist der Unterschied zwischen SQL-Einbettung und Integriere Sprache/ Spracherweiterung?
ist letzteres gleich dem Konzept 'Relationale Anwendungsprogrammierschnittstellen (API)'?
oder was ist nun wieder der Unterschied zu den APIs?
was ist denn die Mehrsprachenfähigkeit bei den APIs?
gibt es das Cursor-Konzept nur bei den APIs oder wo noch
(die Beispiele sind alle in 'exec sql' = SQL-Einbettung?
obwohl doch nur für APIs gedacht?
-> was ist der Unterschied zwischen SQL-Einbettung <-> APIs <-> Integriere Sprache/ Spracherweiterung?)
-> ist das Cursor-Konzept der einzige Unterschied zwischen Satzverarbeitung hin zu 'Mengenorientierung'?
———
TA-Konzept, Konsistenzebene 0:
wieso sollten kurze Schreibsperren Lost Update verhindern könnnen?
—–
Data Warehouse:
Data cube: was ist denn der Unterschied zwischen normalisierten Stern und Schneeflocke?
Level-Stern:
wozu die Level-ID?,
sehe ich das richtig das hier neben den Dimensionstabellen auch
die Faktentabelle mehrfach gespeichert wird, auf jedem Granularitätslevel?
—–
Data Mining:
Dimensionalitätsreduzierung:
Minimum Subset Selection:
inwiefern werden da subsets gebildet?,
zum Beispiel bei den angegebenen Beispiel mit X,Y,C, was ist da das subset?
Klassifikation:
bootstrapping, was heißt das auf deutsch/ wie geht das?
den Zusammhang z.B. zu
http://www.websters-online-dictionary.org/definition/english/bo/bootstrap.html
sehe ich nicht so ;)
edit
ah, ist da doch vorhanden unter Statistik, aber auch nicht so endgültig erklärt..
Klassifikation-Evaluierung:
sind FAR/ FRR entsprechend das gleiche wie V und R aus Document Retrieval-Kapitel?
falls sie nicht übereinstimmen: was bedeuten sie dann und wieso gibts da einen Trade Off?
was sind p(true), p(false), wieso ist e_max = min (p(false),p(true)),
was soll diese 'maximale Fehlerrate' aussagen?
Clustering:
lokales Clustering Kriterium MND:
ist MND vom Clustering abhänging?, wenn ja wieso?,
ist das nicht immer gleich, die Datenpunkte ändern sich doch nicht,
-> wie ändern sich die MND-Werte?
wenn sich MND ändert
(vielleicht gehen nur die Punkte des aktuellen Clusters ins Ranking ein?):
gibt es einen Trade Off zwischen MND und globalen Kriterium oder streben beide in die gleiche Richtung?
——-
ein Link zu Data Mining:
www.icaen.uiowa.edu/~comp/Public/Kantardzic.pdf