/ Forside / Teknologi / Udvikling / PHP / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
PHP
#NavnPoint
rfh 3959
natmaden 3372
poul_from 3310
funbreak 2700
stone47 2230
Jin2k 1960
Angband 1743
Bjerner 1249
refi 1185
10  Interkril.. 1146
Søgning i PDF filer
Fra : Søren Reinke


Dato : 22-06-05 19:44

Hejsa

Er der nogen der ved hvordan man fra PHP kan søge efter tekst inden i en
PDF fil ?

--
Søren Reinke
www.Xray-Mag.com/ - dit gratis dykkermagasin på nettet

 
 
Peter Brodersen (22-06-2005)
Kommentar
Fra : Peter Brodersen


Dato : 22-06-05 23:23

On Wed, 22 Jun 2005 20:44:14 +0200, Søren Reinke
<soren@fjern.reinke.dk> wrote:

>Hejsa
>
>Er der nogen der ved hvordan man fra PHP kan søge efter tekst inden i en
>PDF fil ?

Det er ikke muligt uden videre fra PHP, heller ikke med de typiske
PDF-funktioner. De giver blot mulighed for at lave nye PDF'er.

I en webmail-lignende applikation benytter jeg selv programmet
pdftotext til at læse tekstindholdet fra en PDF-fil. Det kræver, at du
har mulighed for at afvikle programmer i din PHP-opsætning (hvilket
normalt ikke er muligt eller hensigtsmæssigt hos en webhotel-udbyder).

pdftotext:
http://www.foolabs.com/xpdf/download.html

PHP-oneliner til at læse indholdet af en PDF ind i en variabel:
$content = shell_exec("pdftotext dokument.pdf -");

Simpelt eksempel med søgeresultat i PDF:
http://stock.ter.dk/pdfsearch.php
(i princippet bare en søgning i $content med et regulært udtryk)

Når det er muligt at læse indholdet på den måde, kan man altid
overveje at smide tekst-indholdet ind i en database eller på anden
måde indeksere det.

--
- Peter Brodersen

Søren Reinke (23-06-2005)
Kommentar
Fra : Søren Reinke


Dato : 23-06-05 06:44

Hej Peter

>>
>>Er der nogen der ved hvordan man fra PHP kan søge efter tekst inden i en
>>PDF fil ?
>
>
> Det er ikke muligt uden videre fra PHP, heller ikke med de typiske
> PDF-funktioner. De giver blot mulighed for at lave nye PDF'er.

Hmmm tænkte jeg nok :)

>
> I en webmail-lignende applikation benytter jeg selv programmet
> pdftotext til at læse tekstindholdet fra en PDF-fil. Det kræver, at du
> har mulighed for at afvikle programmer i din PHP-opsætning (hvilket
> normalt ikke er muligt eller hensigtsmæssigt hos en webhotel-udbyder).

Ikke noget problem jeg har min egen dedikerede server :)

>
> pdftotext:
> http://www.foolabs.com/xpdf/download.html
>
> PHP-oneliner til at læse indholdet af en PDF ind i en variabel:
> $content = shell_exec("pdftotext dokument.pdf -");
>
> Simpelt eksempel med søgeresultat i PDF:
> http://stock.ter.dk/pdfsearch.php
> (i princippet bare en søgning i $content med et regulært udtryk)
>
> Når det er muligt at læse indholdet på den måde, kan man altid
> overveje at smide tekst-indholdet ind i en database eller på anden
> måde indeksere det.

Lige netop, det var det jeg håbede man kunne gøre, mange tak for tippet,
samt for linken med det lille eksempel :)


--
Søren Reinke
www.Xray-Mag.com/ - dit gratis dykkermagasin på nettet

Søg
Reklame
Statistik
Spørgsmål : 177501
Tips : 31968
Nyheder : 719565
Indlæg : 6408527
Brugere : 218887

Månedens bedste
Årets bedste
Sidste års bedste