Regular expression ile bir dökümandaki web adreslerini yakalama

Bir döküman üzerindeki belirli bir ifadeye sahip içeriği ayrıştırmak yada değiştirmek için regular expression kullanılabilir. Bunun için Java da regex kütüphanesini inceleyebilirsiniz; ayrıştırdığınız içerik web adresi, email adresi, telefon numaraları vs.. olabilir yanlız bunun için bir pattern yazmanız gerekiyor. Pattern yazımı için aşağıdaki linki inceleyebilirsiniz.
http://java.sun.com/j2se/1.4.2/docs/api/java/util/regex/Pattern.html
Aşağıdaki örnekte web adresleri için url ler ayrıştırılıyor.

    import java.util.regex.Matcher;
    import java.util.regex.Pattern;
     
    public class Demo {
      public static void main(String args[]) throws Exception {
        String regex = "(?<=http://)\\S+";
        Pattern pattern = Pattern.compile(regex);
     
        String icerik = "Deneme amacli bir yazi ";
        icerik += "http://java.sun.com http://www.melihsakarya.com http://www.ayvalik.org bakalim bunlari yakalayabilecekmi ";
        icerik += "milliyet deneme http://www.milliyet.com.tr/2008/12/10/ekonomi/?ver=60 iste ilk 11ler&ver=06 b alanı görmemeli";
     
        Matcher matcher = pattern.matcher(icerik);
     
        while (matcher.find()) {
          String msg = matcher.group();
          System.out.println(msg);
        }
      }
    }
No comments yet.

Leave a comment

XHTML: You can use these tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>