/ Forside / Teknologi / Udvikling / PHP / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
PHP
#NavnPoint
rfh 3959
natmaden 3372
poul_from 3310
funbreak 2700
stone47 2230
Jin2k 1960
Angband 1743
Bjerner 1249
refi 1185
10  Interkril.. 1146
Rtf2txt
Fra : Arne Feldborg


Dato : 07-06-08 00:38


hejsa...

Er der nogen her, der lige sidder med en rutine der kan konvertere
rtf-filler til tekstfiler.?

Jeg ved godt, at php måske ikke lige er det mest velvalgte værktøj til
den opgave. Men det er nu altså det jeg lige her og nu har til rådighed
for opgaven.

Jeg ved også godt, at det i princippet er en meget simpel opgave, som
man sagtens selv kunne arbejde sig frem til.

Men hvorfor opfinde den dybe tallerken, hvis det allerede er sket.?

--
mvh, A:\Feldborg

Slægtsforskning og lokalhistorie i midt- vestjylland
http://hammerum-herred.dk/

 
 
Gert Krabsen (07-06-2008)
Kommentar
Fra : Gert Krabsen


Dato : 07-06-08 10:20

Arne Feldborg skrev:
> hejsa...
>
> Er der nogen her, der lige sidder med en rutine der kan konvertere
> rtf-filler til tekstfiler.?
>
> Jeg ved godt, at php måske ikke lige er det mest velvalgte værktøj til
> den opgave. Men det er nu altså det jeg lige her og nu har til rådighed
> for opgaven.
>
> Jeg ved også godt, at det i princippet er en meget simpel opgave, som
> man sagtens selv kunne arbejde sig frem til.
>
> Men hvorfor opfinde den dybe tallerken, hvis det allerede er sket.?

Er det meget store .rtf-filer?

Er det afgørende, at det er en net-baseret løsning?

Kig evt. på FCK-editor (ja, det hedder den!) Den kan en hel del..
http://www.fckeditor.net/



Bertel Lund Hansen (07-06-2008)
Kommentar
Fra : Bertel Lund Hansen


Dato : 07-06-08 16:11

Gert Krabsen skrev:

> Kig evt. på FCK-editor

OpenOffices Writer kan også gøre det.

--
Bertel
http://bertel.lundhansen.dk/      FIDUSO: http://fiduso.dk/

Holst (07-06-2008)
Kommentar
Fra : Holst


Dato : 07-06-08 18:04


Bertel Lund Hansen wrote:

>> Kig evt. på FCK-editor
>
> OpenOffices Writer kan også gøre det.

De fleste tekstbehandlingsprogrammer kan vel klare det, men når man
tager gruppe, i hvilken spørgsmålet er stillet, i betragtning, så er det
jo næppe den løsning, han søger.

Arne Feldborg (07-06-2008)
Kommentar
Fra : Arne Feldborg


Dato : 07-06-08 18:53

Bertel Lund Hansen <unospamo@lundhansen.dk> skrev Sat, 07 Jun 2008
17:11:19 +0200


>OpenOffices Writer kan også gøre det.
>
Hvis jeg manuelt skal hente og gemme hver fil, så kunne jeg vel lige så
godt bruge Word.?

--
mvh, A:\Feldborg

Slægtsforskning og lokalhistorie i midt- vestjylland
http://hammerum-herred.dk/

Arne Feldborg (07-06-2008)
Kommentar
Fra : Arne Feldborg


Dato : 07-06-08 18:52

Gert Krabsen <fjernkrabsen@fjernkrabsenfjern.dk> skrev Sat, 07 Jun 2008
11:20:22 +0200

>
>Er det meget store .rtf-filer?
>
Både nogle små og nogle store. Men det drejer sig om en hel del filer.

>Er det afgørende, at det er en net-baseret løsning?
>
Både og. Det skal være i et sprog jeg kan finde ud af, og det begrænser
udvalget ganske betydeligt.

Pointen er dels, at tekstfilerne skal navnegives udfra en bestemt linie
i teksten og dels, at der også på andre måder skal manipuleres med
teksten. Samt at ind- og udlæsning skal ske automatisk for en hel mappe.

Men selve konverteringen består jo egentlig bare i at fjerne al
formatering bortset fra "/par" og så udskifte alle hi-bit karakterer
med ansi tegn.

Det var bare det, at hvis der allerede fandtes en funktion til dette så
var jeg jo fri for at lave det selv


--
mvh, A:\Feldborg

Slægtsforskning og lokalhistorie i midt- vestjylland
http://hammerum-herred.dk/

Gert Krabsen (07-06-2008)
Kommentar
Fra : Gert Krabsen


Dato : 07-06-08 22:29

Arne Feldborg skrev:
> Gert Krabsen <fjernkrabsen@fjernkrabsenfjern.dk> skrev Sat, 07 Jun 2008
> 11:20:22 +0200
>
>> Er det meget store .rtf-filer?
>>
> Både nogle små og nogle store. Men det drejer sig om en hel del filer.
>
>> Er det afgørende, at det er en net-baseret løsning?
>>
> Både og. Det skal være i et sprog jeg kan finde ud af, og det begrænser
> udvalget ganske betydeligt.


Ja det er jo hårde vilkår

Det letteste ville jo nok være at lave et PC-program i f.eks. Visual
Basic, hvor man så 'fjernstyrer' Word, det er ikke det store problem.

Noget tilsvarende kan gøres i PHP, f.eks. ved hjælp af FCK editor, men
det er lidt mere kringlet at skrive til fil ( jeg bruger FCK-editor til
tekster, der gemmes i en database).

> Det var bare det, at hvis der allerede fandtes en funktion til dette så
> var jeg jo fri for at lave det selv

Helt enig. Du har naturligvi søgt på 'php doctype converter' og
lignende, så jeg vil ikke fornærme dig ved at komme med forslag herfra;
dem har du nok været igennem

Arne Feldborg (07-06-2008)
Kommentar
Fra : Arne Feldborg


Dato : 07-06-08 23:34

Gert Krabsen <fjernkrabsen@fjernkrabsenfjern.dk> skrev Sat, 07 Jun 2008
23:28:43 +0200


>Det letteste ville jo nok være at lave et PC-program i f.eks. Visual
>Basic, hvor man så 'fjernstyrer' Word, det er ikke det store problem.
>
>Noget tilsvarende kan gøres i PHP, f.eks. ved hjælp af FCK editor, men
>det er lidt mere kringlet at skrive til fil ( jeg bruger FCK-editor til
>tekster, der gemmes i en database).
>
Jo, men jeg kan ikke rigtig se nogen grund til at bruge externe
programmer. Det kan da sagtens laves i ren PHP.

En rtf-fil er jo en ren tekstfil. Man skal bare læse filen, lave et
antal søg&erstat, og så gemme den igen.


--
mvh, A:\Feldborg

Slægtsforskning og lokalhistorie i midt- vestjylland
http://hammerum-herred.dk/

Arne Feldborg (08-06-2008)
Kommentar
Fra : Arne Feldborg


Dato : 08-06-08 23:11

Gert Krabsen <fjernkrabsen@fjernkrabsenfjern.dk> skrev Sat, 07 Jun 2008
23:28:43 +0200


>Noget tilsvarende kan gøres i PHP, f.eks. ved hjælp af FCK editor, men
>det er lidt mere kringlet at skrive til fil ( jeg bruger FCK-editor til
>tekster, der gemmes i en database).
>
Jeg har nu kigget lidt på den, men jeg har lidt svært ved at finde ud
af, hvordan jeg skal bruge den i den her sammenhæng.

Hvordan får jeg den til at batch-konvertere fra een filtype til en
anden.?
Hvordan får man den i det hele taget til at læse ind fra en rtf-fil og
derefter fjerne formateringen.?

--
mvh, A:\Feldborg

Slægtsforskning og lokalhistorie i midt- vestjylland
http://hammerum-herred.dk/

Michael Rasmussen (07-06-2008)
Kommentar
Fra : Michael Rasmussen


Dato : 07-06-08 20:30



Arne Feldborg (08-06-2008)
Kommentar
Fra : Arne Feldborg


Dato : 08-06-08 23:49

Michael Rasmussen <mir@miras.org> skrev Sat, 7 Jun 2008 21:30:18 +0200

>
>Hører Perl til et sprog, du kan finde ud af?
>http://search.cpan.org/~sargie/RTF-Parser-1.09/lib/RTF/TEXT/Converter.pm
>
Jeg kan ikke bruge det direkte. Men jeg har kigget lidt på koden, og der
er måske noget jeg kan bruge.

--
mvh, A:\Feldborg

Slægtsforskning og lokalhistorie i midt- vestjylland
http://hammerum-herred.dk/

Martin (08-06-2008)
Kommentar
Fra : Martin


Dato : 08-06-08 10:37

Arne Feldborg wrote:
> hejsa...
>
> Er der nogen her, der lige sidder med en rutine der kan konvertere
> rtf-filler til tekstfiler.?
>
> Jeg ved godt, at php måske ikke lige er det mest velvalgte værktøj til
> den opgave. Men det er nu altså det jeg lige her og nu har til rådighed
> for opgaven.
>
> Jeg ved også godt, at det i princippet er en meget simpel opgave, som
> man sagtens selv kunne arbejde sig frem til.
>
> Men hvorfor opfinde den dybe tallerken, hvis det allerede er sket.?
>

Metode 1:
Det der er så smart med FCKeditor er at det er opensource, og da
FCKeditor har en indbygget funktion til at fjerne alt formatering fra
fx. Word og RTF filer, ja, så kan den funktion helt sikkert også findes
i koden somewhere :)

Metode 2:
preg_replace kan også bruges - dog er det nok noget der skal testes en
masse gange før det tages i produktion

Metode 3:
Konverter RTF'en til HTML, og derfra bruge strip_tags()
Man kan købe en RTF til HTML converter, eller man kan bruge en online
converter, eller man kan være så smart at bruge CURL også bruge en
online converter :)

Metode 4:
Man kan downloade denne

Martin (08-06-2008)
Kommentar
Fra : Martin


Dato : 08-06-08 10:37

Martin wrote:
> Metode 4:
> Man kan downloade denne

og denne er
http://www.phpclasses.org/browse/file/7632.html
:)

Arne Feldborg (08-06-2008)
Kommentar
Fra : Arne Feldborg


Dato : 08-06-08 23:47

Martin <martin@aarhof.invalid> skrev Sun, 08 Jun 2008 11:36:57 +0200


>Metode 1:
>Det der er så smart med FCKeditor er at det er opensource, og da
>FCKeditor har en indbygget funktion til at fjerne alt formatering fra
>fx. Word og RTF filer, ja, så kan den funktion helt sikkert også findes
>i koden somewhere :)
>
Er det ikke kun fra tekst der er indsat fra klippebordet.?

>preg_replace kan også bruges - dog er det nok noget der skal testes en
>masse gange før det tages i produktion
>
Når man har fjernet formateringen handler det jo bare om at ændre nogle
ascii værdier til de tilsvarende karakterer.

\'d8 til Ø
\'c5 til Å
\'e6 til æ
\'e5 til å

Jeg er ikke så skrap til regulære udtryk, så jeg ville nok håndtere dem
enkeltvis. Men det kunne sikkert også gøre på den måde du foreslår.


>Konverter RTF'en til HTML, og derfra bruge strip_tags()
>Man kan købe en RTF til HTML converter, eller man kan bruge en online
>converter, eller man kan være så smart at bruge CURL også bruge en
>online converter :)
>
Vel lidt som at gå over åen efter vand, men måske en mulighed.


>Metode 4:
>Man kan downloade denne
>
Den er han vist aldrig blevet helt færdig med, men måske kan noget af
koden bruges.

--
mvh, A:\Feldborg

Slægtsforskning og lokalhistorie i midt- vestjylland
http://hammerum-herred.dk/

Martin (09-06-2008)
Kommentar
Fra : Martin


Dato : 09-06-08 01:47

Arne Feldborg wrote:
> Martin <martin@aarhof.invalid> skrev Sun, 08 Jun 2008 11:36:57 +0200
>
>
>> Metode 1:
>> Det der er så smart med FCKeditor er at det er opensource, og da
>> FCKeditor har en indbygget funktion til at fjerne alt formatering fra
>> fx. Word og RTF filer, ja, så kan den funktion helt sikkert også findes
>> i koden somewhere :)
>>
> Er det ikke kun fra tekst der er indsat fra klippebordet.?
>
>> preg_replace kan også bruges - dog er det nok noget der skal testes en
>> masse gange før det tages i produktion
>>
> Når man har fjernet formateringen handler det jo bare om at ændre nogle
> ascii værdier til de tilsvarende karakterer.

og formateringen i sig selv er godt nok en ordentlig bunke hø - men ja,
det handler jo bare om at få formateringen væk, så det er ren tekst tilbage.

>
> \'d8 til Ø
> \'c5 til Å
> \'e6 til æ
> \'e5 til å
>
> Jeg er ikke så skrap til regulære udtryk, så jeg ville nok håndtere dem
> enkeltvis. Men det kunne sikkert også gøre på den måde du foreslår.
>
>
>> Konverter RTF'en til HTML, og derfra bruge strip_tags()
>> Man kan købe en RTF til HTML converter, eller man kan bruge en online
>> converter, eller man kan være så smart at bruge CURL også bruge en
>> online converter :)
>>
> Vel lidt som at gå over åen efter vand, men måske en mulighed.

Hvis ikke der er vand på denne side af åen, så er det jo den eneste
mulighed :)

>> Metode 4:
>> Man kan downloade denne
>>
> Den er han vist aldrig blevet helt færdig med, men måske kan noget af
> koden bruges.
>

Så vidt jeg læser, så er det en videreudvikling (extension) til en anden
klasse, dog synes jeg ikke der bliver nævnt noget om hvilken anden
klasser der er tale om

Søg
Reklame
Statistik
Spørgsmål : 177558
Tips : 31968
Nyheder : 719565
Indlæg : 6408921
Brugere : 218888

Månedens bedste
Årets bedste
Sidste års bedste