[Hejmen]X-Sistemo/Priparolu

Hejmpaĝo | X-Sistemo | Lastaj Ŝanĝoj | Preferoj | Uzu X-Sistemon

Kiel estis kalkulitaj la statistikoj pri iksa kaj unikoda en la TTT? Mi mem faris plurajn provojn per google, kiuj donas avantaĝon al unikodo antaŭ la iksa. --Zav'

Mi ne klare memoras, sed mi supozas, ke mi serĉis pri "kaj+estas" per Google kaj rigardis al la unuaj dudek paĝoj. Sed tio estis en 2001, eble antaŭ dek monatoj. --Stefano KALB


Jen kelkaj rezultoj de testoj kiujn mi fari la 6an de aprilo 2002, do nur antaŭ kelkaj tagoj. Mi afiŝis ilin en soc.culture.esperanto la saman tagon: http://groups.google.com/groups?num=100&hl=eo&q=unikodo+iksa+statistiko

Mi testis la frekvencon laŭ google de la apero de "kaj" kune kun oftaj vortoj entenante supersignon. Mi testis ĉiufoje kvar metodojn: la iksa, la h-a, la unikoda kaj la latino3a:

"ĉar+kaj":
-unikode: 8330
http://www.google.com/search?q=%26%23265%3Bar%2Bkaj&hl=eo&oe=utf-8
-ikse: 5590
http://www.google.com/search?num=100&hl=eo&safe=off&q=cxar%2Bkaj
-h-e: 4390
http://www.google.com/search?num=100&hl=eo&safe=off&q=char%2Bkaj
-latin3: 1280
http://www.google.com/search?num=100&hl=eo&safe=off&q=%E6ar%2Bkaj

"ĉu+kaj":
-h-e: 7080
http://www.google.com/search?num=100&hl=eo&safe=off&q=chu%2Bkaj
-unikode
http://www.google.com/search?num=100&hl=eo&oe=utf-8&safe=off&q=%26%23265%3Bu%2Bkaj
-ikse: 6110
http://www.google.com/search?num=100&hl=eo&safe=off&q=cxu%2Bkaj
-latin3: 3160
http://www.google.com/search?num=100&hl=eo&safe=off&q=%E6u%2Bkaj

Ŝajnas ke la prezenco de "chu" estas tro forte taksita ĉar ĝi ofte aperas en titoloj de unikodaj paĝoj ĉar malendas uzi unikodon en kaptitolo de la TTT-paĝoj.

"ĝi+kaj"
-unikode: 10400
http://www.google.com/search?num=100&hl=eo&oe=utf-8&safe=off&q=%26%23285%3Bi%2Bkaj
-ikse: 7640
http://www.google.com/search?num=100&hl=eo&safe=off&q=gxi%2Bkaj
-h-e: 4320
http://www.google.com/search?num=100&hl=eo&safe=off&q=ghi%2Bkaj
-latino3: 3760
http://www.google.com/search?num=100&hl=eo&safe=off&q=%F8i%2Bkaj

Ne facilas taksi la gravecon de aliaj sistemoj ĉar la serĉado malfacile konsideras la supersignojn "^'". Do malfacilas konkludi sed laŭ tiuj diversaj testoj, ŝajnas ke unikodo nun pli fortas ol la iksa metodo en la TTT. La fundamenta ŝajnas pli malpli samforta ol la iksa.

Ŝajnas ke eblus relative facile fari pli seriozan enketon ĉar la tuta eo-TTT ne tre grandas. Sufiĉus konstrui roboton kiu tralegu paĝojn en Esperanto kaj esploru ĉiujn ligilojn de la paĝoj. Ĝi rigardu en ĉiuj tiuj paĝoj ĉu aperas kelkajn el la plej oftaj vortoj de Esperanto. Se jes ĝi registru la URL-on, studu la paĝon por registri kelkajn informojn: domajn-nomo, skrib-sistemo,... kaj esploru la ligilojn...

Bona ejo por ekigi la roboton estas la esperanta kategorio de Dmoz: http://dmoz.org/World/Esperanto/

Se iu havas sperton por fari tion... :-) Povus esti interese por scii pli precize kiom da paĝoj ekzistas en Esperanto.


Eble indus instali tiun longan prezentadon en specifa paĝo... --Zav

Hejmpaĝo | X-Sistemo | Lastaj Ŝanĝoj | Preferoj | Uzu X-Sistemon
Eblas nur legi tiun ĉi paĝon | Vidu aliajn reviziojn
Laste redaktita April 13, 2002 7:19 am by Zav' (diferencoj)
Serĉu: