FB18.de - Das Informatikforum
sprachverarbeitung... porter stemmer funktion! - Druckversion

+- FB18.de - Das Informatikforum ( /mybb )
+-- Forum: Off-Topic ( /forumdisplay.php?fid=115 )
+--- Forum: Hard- und Softwarefragen ( /forumdisplay.php?fid=48 )
+--- Thema: sprachverarbeitung... porter stemmer funktion! ( /showthread.php?tid=11324 )


sprachverarbeitung... porter stemmer funktion! - Anonymer User - 03.05.2010 15:42

hallo leute!

ich verwende für ein programm den porter stemmer algorithmus fürs deutsch... mir geht aber einfach nicht auf, was der eine schritt beim preproccessing bewirkt... evtl habt ihr ja ein besseres auge dafür ;-) geht halt darum, wörter auf ihren wortstamm zurückzuführen

hier ist der abschnitt:

The stemming algorithm
German includes the following accented forms,

ä   ö   ü

and a special letter, ß, equivalent to double s.

The following letters are vowels:

a   e   i   o   u   y   ä   ö   ü

First, replace ß by ss, and put u and y between vowels into upper case. R1 and R2 are first set up in the standard way (see the note on R1 and R2), but then R1 is adjusted so that the region before it contains at least 3 letters.

wieso U und Y zwischen vokalen in grossbuchstaben verwandeln?! im postproccessing werden diese wieder klein gemacht... welche fälle gibt es denn in der deutschen sprache, wo sowas relevant wäre?!?

ganzer algorithmus gibt es hier:
http://snowball.tartarus.org/algorithms/german/stemmer.html

in "code"form hier:
http://snowball.tartarus.org/algorithms/german/stem_ISO_8859_1.sbl

ihr würdet mir sehr helfen :-)