Quay về Bạn đang ở trang: Home Kiến thức phổ thông Tin học Joomla Plugin - Module - Extension joomla Hướng Dẫn Sử Dụng E-Content - Tạo trang web lấy tin tự động trong joomla

Hướng Dẫn Sử Dụng E-Content - Tạo trang web lấy tin tự động trong joomla

Được đăng ngày Thứ sáu, 08 Tháng 3 2013 23:17
loading...

Chia sẻ bài viết của bạn qua:

E-content là một plugin tự động cập nhật tin tức cho các website được thiết kế bằng joomla. 

Một số vấn đề về Biểu Thức Chính Quy Rgl trước khi bắt đầu sử dụng E content

Rgl: là dùng những ký tự đặc biệt thay thế các dữ liệu muốn tìm kiếm.

 

3 ký tự sẽ dùng xuyên suốt trong E-Content

1. \s* dùng để thay thế 1 khoảng trắng (a b ==> a\s*b)
2. .*? dùng thay thế mọi ký tự (abcd ... )
3. \ Làm cho nó không hiểu lầm với biểu thức của rgl (ex: </div> khi ghi trong rgl thì / <-- của thẻ div nó trùng với ký tự trong rgl nó sẽ không hiểu thẻ </div> nữa nên mình phải gán \ vào nó mới hiểu <\/div> )

Điều quan trọng phải viết biểu thức ở trong: Công thức/Biểu thức/ism

Các bước thao tác với Econtent

B1: Tạo mục cập nhật tin tức

Vào Com E-Content (Download tại ĐÂY ) 1 cửa sổ hiện ra bấm vào nút New.


B2.Put Link:

Dán link cần lấy tin vào (Link RSS). Ở Ví dụ này sử dụng mục Công nghệ - Công nghệ - PC World VN
Để lấy tin công nghệ (cũng ko cần tets vì khi bạn vào trang tin này ở ngoài web thì đã biết nó còn chạy ) 


Nhấn Next.

B3: Detail Link:

Bắt đầu sử dụng Rgl để lọc tin từ Web.

Ở Bước này các bạn phải dùng Firebug nhấn từng title của những tin ấy ta thấy được 1 cấu trúc trùng lặp ở đây đó là <div class="item"> <a class="title" href="/articles/cong-nghe/cong-nghe/2012/09/1232938/nhin-lai-cong-nghe-bluetooth/" >Nhìn lại công nghệ Bluetooth</a>

Bước này ta dùng Rgl để lọc những ký tự trong href dựa vào công thức la có:


/<div class="item">\s*<a class="title" href="/(.*?)">.*?<\/a>/ism (copy CT này lại để dùng cho bước sau)

(.*?) được thay cho /articles/cong-nghe/cong-nghe/2012/09/1232938/nhin-lai-cong-nghe-bluetooth/
.*? được thay cho Nhìn lại công nghệ Bluetooth

(Bước này ta chủ yếu lấy dữ liệu trong href nên ta ngoặc nó)

vậy ta viết vào Detail Link như sau: /<div class="item">\s*<a class="title" href="/(.*?)">.*?<\/a>/ism




Các bạn thấy số 1 ghi ở đó tức là lấy ở dấu ngoặc đơn đầu tiên (trường hợp có nhiều ngoặc đơn để phân biệt)
Nhấn test --> Ok ---> nhấn Next

B4: Get title : Lọc title 

Paste dòng công thức Rgl đã copy ở trên

/<div class="item">\s*<a class="title" href="/(.*?)">.*?<\/a>/ism 

Thêm vào ()  .*?

=>/<div class="item">\s*<a class="title" href="/(.*?)">(.*?)<\/a>/ism 



Ghi số 2 (để lọc ở dấu ngoặc đơn thứ 2,Vì bước này mình lấy title)

ấn text-->ok--> Next

B5:Data Way:

Chọn kiểu đổ dữ liệu 


Ở ví dụ này chọn Mainintro and fulltext --> next

B6: Intro text:
Ta dùng firebug bấm vào 1 khung bất kỳ của trang tin để xác định điểm đầu và điểm cuối của cái khung ấy. Hình:

điểm đầu:<div class="list-area">
điểm cuối:<div style="clear: both">

Công thức: giet introtext là : 

/<div class="list-area">(.*?)<div style="clear: both">/ism

Find and Replace (RegExp): /<a href="/.*?">/ism <=> (dòng này bắt buộc phải có dù bất cứ link nào)

Hình: 

Nhấn test ---> ok ----> next

B6:Full text:( lấy nội dung)
Chúng ta cũng xác định điểm đầu và cuối của nội dung
Thực hiện:
nhấn vào trực tiếp 1 tin : xác định điểm đầu của text dùng firebug quét chữ B như Hình để thấy điểm đầu của code hình.



điểm đầu là:<div class="summary" style="margin-bottom: 7px">

rồi dùng Firebug quét điểm cuối của text: hinh


Điểm cuối là:<td class="keyword" align="left">

vậy công thức là 
/<div class="summary" style="margin-bottom: 7px">(.*?)<td class="keyword" align="left">/ism

Hình 


text -- > next

B7-> next


B8: Get number content 10 ( cho lấy 10 tin)


Publishing: 




Qua tab 



Manual. Nhấn vào dấu check nhấn capture để tải link về.

CHÚ Ý : ĐẾN PHẦN SETTING CÓ Ô UNICODE HTML CHỌN "NO" ĐỂ KHÔNG BỊ LỖI FONT KHI ĐỔ DỮ LIỆU.

FILE HINH CHO BẠN NÀO CẦN : hinh econtent.rar

Đến đây là hoàn thành việc cài đặt E-content tự động cập nhật tin cho website joomla 1.5

1 số Rgl mẫu của các trang web

Put link :Tình yêu giới tính - Dân trí

Detail Link:/<div class="mr1">\s*<a class="fon6" href="/(.*?)">.*?<\/a>/ism 1 test
Get title:/<div class="mr1">\s*<a class="fon6" href="/(.*?)">(.*?)<\/a>/ism 2 test

intro text: /<div class="mt3 clearfix">(.*?)<\/div>/ism 1 test
+Find and Replace (RegExp): /<a href="/.*?">/ism <=> 
Full text: /<h2 class="fon33 mt1">(.*?)<div style="text-align:center; padding-top:5px">/ism 1 test
+Find and Replace (RegExp): /<a href="/.*?">/ism <=>


Put link: Cập nhật đời sống teen Việt - Đời sống - Kênh14.vn

Detail link : /<h4 class="title">\s*<a href="/(.*?)">.*?<\/a>/ism test 1
Titles:/<h4 class="title">\s*<a href="/(.*?)">(.*?)<\/a>/ism test 2
Intro text: /<div class="item clearfix">(.*?)<\/ul>/ism test 1
Find and replace:/<a href="/.*?">/ism <=>
Full text: /<p class="sapo">(.*?)<div class="post-share">/ism test 1
Find and replace:/<a href="/.*?">/ism <=>

Put link: Điện thoại: thông số, cấu hình, công dụng, chức năng - Số Hóa VnExpress
link:/<h3 class="h3Homen">\s*<a href="/(.*?)">.*?<\/a>/ism test1
Titles :/<h3 class="h3Homen">\s*<a href="/(.*?)">(.*?)<\/a>/ism test2
Intro:/<h3 class="h3Homen">(.*?)<div class="share-link">/ism test1
Find and repalce :/<a href="/.*?">/ism <=>
Full :/<p class="dt-pts">(.*?)<strong>/ism test1
Find and repalce :/<a href="/.*?">/ism <=>

Put link: An ninh hinh su,Tin tuc Phap luat,Bao An ninh Cong an 24H 

Detail Links : /<div class="div_title_news">\s*<a href="/(.*?)" title="(.*?)">.*?<\/a>/ism test 2 
Titles: /<div class="div_title_news">\s*<a href="/(.*?)" title="(.*?)">(.*?)<\/a>/ism test 3
Introtext:/<div class="boxDonItem">(.*?)<div class="divXemTiep">/ism 1test
Find and repalce: /<a href="/.*?">/ism <=>
Fulltext : /<div class="baiviet-head-noidung">(.*?)<div class="nguontin">/ism 1test
Find and repalce: /<a href="/.*?">/ism <=>

                                                                                              Nguồn: Vietcanh

Chia sẻ bài viết của bạn qua:

loading...
loading...