百度首页 | 百度空间
 
查看文章
 
xml 点评网 餐饮美食
2008-01-15 17:46
<?xml version="1.0" encoding="UTF-8"?>
<cfconfig charset="utf-8">
<include path="functions.xml"/>
<var-def name="url">
   <template>http://www.dianping.com/search_m/10/10_</template>
</var-def>
<script><![CDATA[
     
          String getKeys(str) {
         
          //str = str.substring(0, str.indexOf("<br/>"));
         //str = str.substring(str.indexOf("地址:") + 7 ,str.length()).trim();
         if(str.indexOf("地址")<=0)
         {
            str="null";        
         }
         else
         {
            if(str.indexOf("别名")>=0)
            {
              str="null";
            }
            else
            {
            str = str.substring(0, str.indexOf("<a"));
            str = str.substring(str.indexOf("地址:") + 7 ,str.length()).trim();  
            }
         }
       
         return str;
          }
    
        String getPhone(str) {
              stars   = str.indexOf("电话:");
            
              if(stars<=0)
              {
                str="null";
              }
              else
              {
                 ends= str.lastIndexOf("<br/>");
                 stars=stars+7;
                 str = str.substring(stars ,ends).trim();
              }
              return str;
          }
     
        String getTags(str)
        {
         
            stars   = str.indexOf("标签:");
            if(stars<=0)
            {
            str="null";
            }
            else
            {
                 ends= str.lastIndexOf("</div>");       
                 stars=stars+7;
                 str = str.substring(stars,ends).trim();
            }
              return str;
      }
   
    
         
         
    ]]></script>
<var-def name="infoLinks">
   <call name="download-multipage-list">
    <call-param name="pageUrl"><var name="url"/></call-param>
    <call-param name="nextXPath">//a[.='下一页']/@href</call-param>
    <call-param name="itemXPath">//div[@class="ShopInfo"]</call-param>
    <call-param name="maxloops">2</call-param>
   </call>
</var-def>
<var-def name="host">http://www.dianping.com/</var-def>
<file action="write" path="eatting.txt">
   <loop item="item" index="i">
    <list>
     <var name="infoLinks"/>
    </list>
    <body>
    <empty>
      <var-def name="Curl">
           <var name="host"/>
           <xpath expression="data(//p[@class='ShopName']/a/@href)">
              <var name="item"/>
           </xpath>
      </var-def>
    </empty>
    <empty>
     <var-def name="contents">
      <call name="download-signle-content">
       <call-param name="contentUrl"><var name="Curl"/></call-param>
       <call-param name="itemXPath">//div[@class='ClassLeft']</call-param>
      </call>
     </var-def>
    </empty>
    <empty>
        <var-def name="detailName">
            <xpath expression="//div[@class='Item'][3]/div/a/text()">
                <var name="contents"/>
            </xpath>
        </var-def>
        <var-def name="className">
            <xpath expression="//div[@class='Item'][1]/div/a/text()">
                <var name="contents"/>
            </xpath>
        </var-def>
        <var-def name="money">
            <xpath expression="//div[@class='Score']/span[4]/text()">
                <var name="contents"/>
            </xpath>
        </var-def>
        <var-def name="detail">
                        <xpath expression="//div[@class='Info']">
                            <var name="contents"/>
                        </xpath>
        </var-def>
        <var-def name="title">
                        <xpath expression="//div[@class='Title']/h1[1]/text()">
                            <var name="contents"/>
                        </xpath>
        </var-def>
       
    </empty>
    <script><![CDATA[
                    String strs   = detailName.toString();
                    String claName= className.toString();
                    String mon    =    money.toString();
                   
                    String titles =title.toString();
                    String details = detail.toString();
                    String deta = getKeys(details).trim();
                    String phone= getPhone(details).trim();
               
               
                   
                    ]]></script>
    <template><![CDATA[
                    <music>
                    <name>${titles},${strs},${claName},${mon},${deta},${phone}</name>
                    </music>
                     ]]>  
                      
                </template>   
    </body>
   </loop>
</file>
</cfconfig>

类别:Webharvest | 添加到搜藏 | 浏览() | 评论 (0)
 
最近读者:
 
网友评论:
发表评论:
姓 名:
网址或邮箱: (选填)
内 容:
验证码:
 

     

©2008 Baidu