"dayoldnewbie" <tja@email.dk> skrev i en meddelelse
news:4694ec4b$0$90262$14726298@news.sunsite.dk...
> Hejsa
>
> Jeg har til opgave at rense noget HTML som skal kunne valideres
> efter det er renset.
>
> Det største problem i filerne er at der bliver gået over til css,
> og der er derfor en masse ekstra kode i filerne som skal væk. Det
> er omkring 1000-1500 filer det drejer sig om.
>
> <body bgcolor="#ffffff">
> <table border="0" cellpadding="0" cellspacing="2" width="100%">
> <tr>
> <td colspan="3" width="100%">
> <table border="0" cellpadding="0" cellspacing="0"
> width="100%" id="AutoNumber1">
> <TR><TD valign="bottom" width="20%"><img
> src="/finansforb/grafik/logofinans.gif"></td>
> </TD><TD></td>
> <TD> </td>
> <TD align="right" valign="bottom">
> <img border="0" src="/graphics/logoprosa.gif">
> </td>
> </TR></TABLE>
>
> Som så skal laves om til f.eks.
>
> <body>
> <table>
> <tr>
> <td colspan="3">
> <table>
> <td><td><img src="/pic.gif"></td></td>
> <td></td>
> <td> </td>
> <td><img border="0" src="/pic.gif"></td>
> </table>
> </tr>
> </table>
> </body>
>
> Koden er ikke lige checket helt igennem. Men princippet er
> ihvertfald at der skal strippes helt ned til basis kode og så
> laves der css på det uden umiddelbar brug af id tags lige pt.
> Stylingen laves på standard tags, men det er ikke noget jeg
> kommer til at rode med.
>
> Der kan også være sådan noget her:
>
> <p style="margin-bottom: 0;"><font color="#000000"><strong><font
> size="4" face="Times New Roman, Times,
> serif">Kommentarer</font></strong></font></p>
>
> Som så igen bliver til:
>
> <p><strong>Kommentarer</strong></p>
> Alt med fonte osv skal helt slettes
>
> Nu åber jeg på at der er nogen af jer kloge hoveder der kender
> noget der kan gøre sådan en kedelig opgave lidt mere
> automatiseret. Det hele skal ses igennem manuelt, men hvis der er
> et værktøj til at gøre det grove ville det være dejligt.
>
> Jeg har set lidt på html tidy og textfilter, men kan ikke helt se
> at de er præcis hvad jeg har brug for. html tidy ser ud til at
> ville lave det om til css i stedet for blot at fjerne en hel del.
>
> Det kan være en del kan gøres med regular expressions, men det
> fatter jeg ikke det store af :P
>
> Håber nogen kan hjælpe mig lidt på vej.
Du kan evt. bruge et søg og erstat tool (erstat med ingenting!)
http://silveragesoftware.com/hffr.html er et godt bud.
Bruger dette program meget ofte.
Du skal dog købe den, hvis den skal søge over et lille antal filer, men til
blot 23$, så er pengene vist tjent hurtigt ind.
God fornøjelse!
Jan
www.jsc.dk