/ Forside / Teknologi / Udvikling / Java / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
Java
#NavnPoint
molokyle 3688
Klaudi 855
strarup 740
Forvirret 660
gøgeungen 500
Teil 373
Stouenberg 360
vnc 360
pmbruun 341
10  mccracken 320
Danske tegn?
Fra : Tonny


Dato : 09-07-04 12:55

Hej NG,

Er der nogle som kan hjælpe med følgende:

Jeg har lavet en installation af http://www.dspace.org her:
http://lissy.ruc.dk/dspace

mit problem er at når man søger på æøå bliver det konverteret til f.eks
æøå

Er der nogle der har en ide eller et hint til hvad det kan være der gør
det eller hvor jeg skal lede?

alt skulle kørt utf-8 dvs. Redhat Enterprise sever 3, tomcat & postgresql.

PFT.

Tonny

 
 
hal@no_spam_statsbib~ (09-07-2004)
Kommentar
Fra : hal@no_spam_statsbib~


Dato : 09-07-04 15:13

Tonny wrote:
> Hej NG,
>
> Er der nogle som kan hjælpe med følgende:
>
> Jeg har lavet en installation af http://www.dspace.org her:
> http://lissy.ruc.dk/dspace
>
> mit problem er at når man søger på æøå bliver det konverteret til f.eks
> æøå
>
> Er der nogle der har en ide eller et hint til hvad det kan være der gør
> det eller hvor jeg skal lede?
>
> alt skulle kørt utf-8 dvs. Redhat Enterprise sever 3, tomcat & postgresql.
>
> PFT.
>
> Tonny

umiddelbart se det ud som om du bruger en af de version er af tomcat -
hvor udviklerne er pedantiske. Du laver søgning via HTTP GET - og i
følge HTTP protocol specifikationen sender GET ikke encoding med i et
request.
I en hel række af tomcat-versioner (fra ca. 4.1.24 til 5.0.18 så vidt
jeg husker) - valgte udvilkerne af tomcat den pedantiske holdning at når
GET ikke medsender en encoding - tolkes alt i requestet som værende i
ISO-8859-1 ( så vidt jeg husker ); med det resultat at sender man UTF-8
til en browser ( hvorefter den har for vane at encode næste forespørgsel
til samme server i samme encoding ) - så vil enhver karakter hvor der
ikke er codepage sammenfald blive fortolket ( bevidst ) forkert. (
ifølge svar på bugzilla er det en feature og ikke en bug )

Du kan hurtigt checke om det er det der er problmet,prøv at ændre
request type fra GET til POST -> virker søgningen nu - har du med
sikkerhed fundet problemet.

Herefter kan du gøre følgende:
1) Op eller nedgrader til passende Tomcat
2) Selv lave implemeteringen af request objektet om i tomcat ( der skal
ikke meget til )
3) sætte en proxy op foran tomcat der omkoder GET request til ISO encoding.

mvh
Hans

hal@no_spam_statsbib~ (09-07-2004)
Kommentar
Fra : hal@no_spam_statsbib~


Dato : 09-07-04 15:29

hal@no_spam_statsbiblioteket.dk wrote:
> Tonny wrote:
>
>> Hej NG,
>>
>> Er der nogle som kan hjælpe med følgende:
>>
>> Jeg har lavet en installation af http://www.dspace.org her:
>> http://lissy.ruc.dk/dspace
>>
>> mit problem er at når man søger på æøå bliver det konverteret til
>> f.eks æøå
>>
>> Er der nogle der har en ide eller et hint til hvad det kan være der
>> gør det eller hvor jeg skal lede?
>>
>> alt skulle kørt utf-8 dvs. Redhat Enterprise sever 3, tomcat &
>> postgresql.
>>

Jeg glemte vist i farten: Har du en ny tomcat installation -> 5.0.18 så
skal den konfigureres til at følge "sidens" encoding - altså et
konfigurations problem. ( default opførsel er skiftet mellem 4 basen og
5 basen af tomcat). se eventulet på følgende bug rapport om 5.0.25

http://issues.apache.org/bugzilla/show_bug.cgi?id=29900

/ Hans

Tonny (11-07-2004)
Kommentar
Fra : Tonny


Dato : 11-07-04 12:32

> umiddelbart se det ud som om du bruger en af de version er af tomcat -
> hvor udviklerne er pedantiske. Du laver søgning via HTTP GET - og i
> følge HTTP protocol specifikationen sender GET ikke encoding med i et
> request.
> I en hel række af tomcat-versioner (fra ca. 4.1.24 til 5.0.18 så vidt
> jeg husker) - valgte udvilkerne af tomcat den pedantiske holdning at når
> GET ikke medsender en encoding - tolkes alt i requestet som værende i
> ISO-8859-1 ( så vidt jeg husker ); med det resultat at sender man UTF-8
> til en browser ( hvorefter den har for vane at encode næste forespørgsel
> til samme server i samme encoding ) - så vil enhver karakter hvor der
> ikke er codepage sammenfald blive fortolket ( bevidst ) forkert. (
> ifølge svar på bugzilla er det en feature og ikke en bug )

Tak for svaret.

Jeg har nu prøvet med Tomcat version 4.1.30 og der er IKKE nogle
problemer, så løsningen kunne være at vi bliver på version 4 eller er
det bedre at komme op på version 5?

Tonny

@(none) (11-07-2004)
Kommentar
Fra : @(none)


Dato : 11-07-04 21:15

> Jeg har nu prøvet med Tomcat version 4.1.30 og der er IKKE nogle
> problemer, så løsningen kunne være at vi bliver på version 4 eller er
> det bedre at komme op på version 5?
>
> Tonny

Nej ( der er sikkert dem der er uenige ). Men

1) den primære forskel på tomcat 4 og 5 er at 5 understøtter den nyere
servlet og jsp sepcifikation - men det bruger dspace alligevel ikke.

2) Der udvikles og vedligeholdes stadig på Tomcat 4 - og den er
naturligvis mere *moden* en 5'erens codebase, hvilken jeg i produktions
milijøer ser som en stor fordel.

Så jeg ville blive på Tomcat 4 indtil enten vedligeholdelsen af den
stopper - eller I får en ny version af dspace der kræver jsp 2.0

mvh
Hans Lund

Søg
Reklame
Statistik
Spørgsmål : 177459
Tips : 31964
Nyheder : 719565
Indlæg : 6408177
Brugere : 218881

Månedens bedste
Årets bedste
Sidste års bedste