Kommentare zu: Ein Quelltext in Perl sieht wirklich oft … http://localhost/blah-dev/2008/03/06/ein-quelltext-in-perl-sieht-wirklich-oft/ Kurz und knapp und blah... Wed, 31 Jul 2013 20:21:22 +0000 hourly 1 http://wordpress.org/?v=3.6 Von: Nachtwächter http://localhost/blah-dev/2008/03/06/ein-quelltext-in-perl-sieht-wirklich-oft/comment-page-1/#comment-117 Nachtwächter Fri, 07 Mar 2008 14:30:41 +0000 http://localhost/blah-dev/2008/03/06/ein-quelltext-in-perl-sieht-wirklich-oft/#comment-117 Ach, diese Umwandlungen sind immer noch eine Strokelwüste, das sind so einige. Natürlich filtere ich hier eine große Menge HTML aus, und das wird auch immer so bleiben. Die anderen Umwandlungen betreffen die Anführungszeichen, die ich lieber »hübsch« mache (wie man hier ja sieht), der Code bedarf mal wieder meiner pflegenden Hand. Es gibt eben keine Sache, die so einfach wäre, dass ich sie nicht falsch machen könnte…

]]>
Von: Renée http://localhost/blah-dev/2008/03/06/ein-quelltext-in-perl-sieht-wirklich-oft/comment-page-1/#comment-115 Renée Fri, 07 Mar 2008 14:03:03 +0000 http://localhost/blah-dev/2008/03/06/ein-quelltext-in-perl-sieht-wirklich-oft/#comment-115 > Der alert war ein netter Versuch, sollte ich auch
> wieder viel öfter machen…

Ja, so etwas macht man bei eigenen Anwendungen viel zu selten ;)

Ich habe mich nur etwas über die Umwandlungen (bzw. Nicht-Umwandlung) von bestimmten Zeichen in den Kommentaren gewundert.

]]>
Von: Nachtwächter http://localhost/blah-dev/2008/03/06/ein-quelltext-in-perl-sieht-wirklich-oft/comment-page-1/#comment-114 Nachtwächter Fri, 07 Mar 2008 12:32:48 +0000 http://localhost/blah-dev/2008/03/06/ein-quelltext-in-perl-sieht-wirklich-oft/#comment-114 Keine Sorte, Renée, diesen RE verwende ich nicht für ein Webprojekt, und HTML::Parser ist mir wohl bekannt. (Obwohl ich fürs Web »poor hackers perl«, also PHP, bevorzuge.) Tatsächlich lässt sich der RE nicht weiter runterbrechen. Es geht hier um etwas, worin Perl wirklich gut ist, um Datenverarbeitung an Textdateien.

Ich habe hier eine handgeschriebene, historisch gewachsene Datei vorliegen (es ist eine Kollektion von Transkriptionen des Voynich-Manuskriptes). Ich wollte die Informationen aus dieser Datei in eine vollständig normalisierte Datenbank bringen, um leichter Analysen machen zu können. (Die erste Version dieser Datenbank ist fertig, Perl ist vergleichen mit anderen Sprachen für so etwas wirklich eine Wucht!)

Diese Datei enthält Meta-Informationen und eigentliche Daten bunt durcheinander, und das keineswegs immer in einem konsistenten Format. Gut, dass es Perl gibt!

Und zum Thema RE: Wenn so ein RE mitten im Quelltext steht und in einer Schleife implizit $_ verwendet, sieht das einfach ein bisschen krank aus. Vor allem, wenn davon ein paar mehr untereinander stehen…

Der alert war ein netter Versuch, sollte ich auch wieder viel öfter machen… ;-)

]]>
Von: Renée http://localhost/blah-dev/2008/03/06/ein-quelltext-in-perl-sieht-wirklich-oft/comment-page-1/#comment-113 Renée Fri, 07 Mar 2008 08:10:14 +0000 http://localhost/blah-dev/2008/03/06/ein-quelltext-in-perl-sieht-wirklich-oft/#comment-113 alert(‹XSS Lücke!‹)

]]>
Von: Renée http://localhost/blah-dev/2008/03/06/ein-quelltext-in-perl-sieht-wirklich-oft/comment-page-1/#comment-112 Renée Fri, 07 Mar 2008 08:09:10 +0000 http://localhost/blah-dev/2008/03/06/ein-quelltext-in-perl-sieht-wirklich-oft/#comment-112 Mmmhhh… Das Parsing der Kommentare ist schlecht, da die spitzen Klammern in den Regulären Ausdrücke nicht umgewandelt werden in < bzw. >

Damit sind die Regexen in meinem Kommentar unvollständig!

]]>
Von: Renée http://localhost/blah-dev/2008/03/06/ein-quelltext-in-perl-sieht-wirklich-oft/comment-page-1/#comment-111 Renée Fri, 07 Mar 2008 08:07:17 +0000 http://localhost/blah-dev/2008/03/06/ein-quelltext-in-perl-sieht-wirklich-oft/#comment-111 Der Teil »^\< [^\\s*« ist Perl-unabhängig. Das sind Reguläre Ausdrücke, wie es sie in vielen Sprachen gibt – und dort sehen sie teilweise noch hässlicher aus, weil man z.B. in Java die »\« nochmal escapen muss.

Außerdem ist dieser Regex schlecht. Übersichtlicher wäre »^< [^\s*«.

Das sieht so aus, als sollten HTML/XML-Tags aus einem Text entfernt werden. Mit so einem Regulären Ausdruck läuft man Gefahr, dass man bei einem nicht ganz sauberen Quelltext das Falsche löscht. Für so etwas sollte man dann besser einen richtigen Parser verwenden (z.B. HTML::Parser).

]]>
Von: Bio http://localhost/blah-dev/2008/03/06/ein-quelltext-in-perl-sieht-wirklich-oft/comment-page-1/#comment-109 Bio Thu, 06 Mar 2008 21:16:54 +0000 http://localhost/blah-dev/2008/03/06/ein-quelltext-in-perl-sieht-wirklich-oft/#comment-109 :lol:

]]>