热门搜索: 物流跟踪 自定义URL oauth2.0 银联
当前位置: 我的shopex插件站 > 资讯 >
本站推荐
详细内容

百度开放平台商品搜索合作API说明文档V1.3

时间:2012-08-29 14:16 来源:未知 作者:admin 点击:

百度开放平台商品搜索合作API说明文档V1.3
目录
    商品接入技术说明    2
1类目数据接口    2
1.1类目数据文件格式说明    2
1.2类目数据接口代码示例    2
2商品数据接口    3
2.1 商品数据文件格式说明    3
2.2 商品数据接口代码示例    4
    常见问题    6


更新时间:2012-6-30


      商品接入技术说明:
1)    简介:新API接口分为3个XML:类目数据XML、全量商品XML、增量商品XML;
类目数据XML(demo:Category.xml,请提供网站的完整类目(建议可与本网站分类同步设置),方便我们做映射,请保持类目数据的同步性);

全量商品XML(demo:data.xml,每天抓取一次,请在每天凌晨3点前全量生成一次);

增量商品XML(demo:update.xml,每30分钟抓取一次,请确保及时更新,更新时无需清空上次数据,每天凌晨3点清空一次即可);

2)    提交新API入口:请贵网站预留出技术排期开发XML文档,上传地址为:http://open.baidu.com/  
登录OPEN平台里-PC端资源添加-商品商业-商品购买(mini)-新商品数据 中添加3个XML商品数据资源即可;


1.类目数据XML文件格式说明:(强调类目数据与商家类目同步)
标签名称     标签说明     示例值    标签类型     可选/必选
cid    商家网站的类目ID;    100    数字    必选
name    商家类目名称    服装    字符串     必选
pid    商家父类目ID,若无父类目,则默认为0;若为10,则表示当前类目的父类目ID为10    0    字符串     必选
number    此类目下的商品数量    1000    数字    必选

1.1类目数据XML代码示例:
<?xml version="1.0" encoding="UTF-8"?>
<cats>
    <cat>
        <cid>100</cid>
        <!--商家类目 ID-->
        <name>服装</name>
        <!--类目名称-->
        <pid>0</pid>
        <!-- 商家父类目ID,如无父类目则默认为0 -->
        <number>1000</number>
        <!-- 此类目下的商品数量 -->
    </cat>
    <cat>
        <cid>101</cid>
        <!--商家类目 ID-->
        <name>男装</name>
        <!--类目名称-->
        <pid>100</pid>
        <!-- 商家父类目ID,如无父类目则默认为0 -->
        <number>500</number>
        <!-- 此类目下的商品数量 -->
    </cat>
        <cat>
        <cid>102</cid>
        <!--商家类目 ID-->
        <name>上衣</name>
        <!--类目名称-->
        <pid>101</pid>
        <!-- 商家父类目ID,如无夫类目则默认为0 -->
        <number>100</number>
        <!-- 此类目下的商品数量 -->
    </cat>
</cats>


2. 全量、增量商品数据XML文件格式说明:(注意全量、增量XML样式相同)
标签名称     标签说明     示例值    标签类型     可选/必选
urlset     urlset用来标记整个文档的开头;注意:以下各字段,必须按给定的顺序组织         /     必选
url     url标记每条商品信息的开始和结束         /     必选
loc     必填;描述商品详细信息页面URL地址,首尾勿带空格、不可见的换行符号     http://www.baidu.com/1232.html
url     必选
lastmod     必填;用来指定该链接的最后更新时间,日期格式为:yyyy-mm-dd     2010-01-05    日期     可选
changefreq     可以不提交该标签;用这个标签告诉此链接可能会出现的更新频率,有效值为:always, hourly,daily,weekly,mothly,yearly,never      always    字符串     可选
priority     可以不提交该标签;用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间     1    小数     可选
data     商品数据内容         /     必选
data_id    必填;商品唯一id,能标识商品唯一id; 如商品是淘宝的,就填写加了前缀的淘宝id,如:tb_淘宝id,其他商品填写商家自有id;    商家自有id:12539493846
商品来自淘宝,如:tb_12345    字符串     必选
display     display字段为固定格式,必有         /     必选
title     必填;商品名称 ,最大150个字符    ThinkPad SL410(2842-EWC)14.0英寸笔记本电脑    字符串     必选
realtitle     可选填;商品型号或货号:去除修饰词后,能唯一标识此商品的名称,一般是品牌+产品型号的组合,最大50个字符    ThinkPad SL410、千鸟格hm262627    字符串     可选
image     必填;商品图片链接:<br>图片请尽量提供宽度在400px以上的;    http://img10.360buyimg.com/S0/4086/0564.jpg
字符串     必选
moreimage    可选填;更多商品图片链接:<br>图片请尽量提供宽度在400px以上的,多个用","区分。    http://img10.360buyimg.com/S0/4086/0564.jpg,http://img10.360buyimg.com/S0/4086/0564.jpg    字符串     可选
originprice    可选填;商品原始价格:<br>保留小数点后两位    5200.00    字符串     可选
price     必填;商品实际价格:最多保留两位小数     4999.00    字符串     必选
brand     选填;商品品牌:当该品牌有中英文两种表示方法时,只要提交其中一个即可。请勿将中英文的品牌混杂在一起提交。否则无法识别准确。无法检索到。 最大50个字符    thinkpad    字符串     可选
cid    必填;商品分类id:多个id用","区分。    101,102    字符串     必填
keywords    必填;商品关键字,可完整描述该商品的名称;keywords词有助于搜索,不得堆砌,需确保所填词能准确描述该商品。
描述词在1至15之间, 不超过5个词组,词组间以"\"分隔,不可空格;最大150个字符     ThinkPad\笔记本电脑    字符串     必选
props    属性项、属性值。不同属性项间以分号分隔,不同属性值间以逗号分隔。最大150个字符    颜色:红色,白色;尺码:35,36,37;风格:日韩;款式:开衫。    文本    可选
services     必填;购买此商品时获得的服务保障:例1~3个6字以内的词,词间以"\"分隔。最大100个字符     正规发票\全国联保\7天退换货    字符串     必选
topay    可选填;是否支持货到付款:0不支持,1支持        字符串    可选
replacement    可选填;支付支持退换货:数字表示可支持退换货的天数,0为不支持。如“7”表示支持7天之内支持退换货    7    字符串     可选
store     必填;商家名,最大10个字符;    京东商城    字符串     必选
stock     必填;商品状态标记:0表示正常;1表示缺货;2表示下架。        字符串     必选
post_fee    必填;是否包邮:0表示不支持;1表示支持        字符串     必填
description     可选填;商品描述:以100字内为佳,不得包含html代码。     SL410概述。The SL410 与上一代SL400系列相比,有了很大的变化:更轻的系统更薄的尺寸(新型的SL系列产品比过去的型号薄4mm,轻12%。    字符串     可选
city     可选填;商品所在地:多个地址间以"\"隔开     北京\上海\广州    字符串     可选
comments     可选填;商品评论条数     150    字符串     可选
commentsurl     可选填;商品评论的链接     http://club.360buy.com/review/199485-1-1.html
url     可选
commentsnote    可选填;商品评论的内容,多个评论请重复此字段    问号|2010-12-12 12:12:12|商品很不错。    文本    可选
expirationdate     可选填;商品下架日期,日期格式为:yyyy-mm-dd     2010-02-09    字符串     可选
score     可选填,b2c商家需填写该商品真正评分,例如 5分\5分;Pintrest商家填写该商品用户喜欢数量,例如 1000    4\5    字符串     可选
barcode    可选填;商品条形码    12312123132123    字符串     可选
mloc    可选填;移动端描述商品详细信息页面URL地址,首尾勿带空格、不可见的换行符号    http://m.baidu.com
url     可选
jumploc    Pintreste商家必填,为商品购买跳转的url,例如http://www.zhimei.com/outer/1396352,B2C网站无需填写,首尾勿带空格、不可见的换行符号;    http://www.zhimei.com/outer/1396352    url    可选

(注:标红为新加或需要谨慎填写字段)




2.1全量、增量商品数据XML代码示例: (注意全量、增量XML样式相同)
  <?xml version="1.0" encoding="UTF-8" ?>
- <urlset>
- <!--  urlset用来标记整个文档的开头;注意:以下各字段,必须按给定的顺序组织
  -->
- <url>
- <!--  url标记每条商品信息的开始和结束
  -->
  <loc>http://baidu.com/1232.html</loc>
- <!--  必填;描述商品详细信息页面URL地址,首尾勿带空格、不可见的换行符号
  -->
  <lastmod>2010-01-01</lastmod>
- <!--  必填;用来指定该链接的最后更新时间,日期格式为:yyyy-mm-dd
  -->
  <changefreq>always</changefreq>
- <!--  可以不提交该标签;用这个标签告诉此链接可能会出现的更新频率,有效值为:always, hourly,daily,weekly,mothly,yearly,never  
  -->
  <priority>1.0</priority>
- <!--  可以不提交该标签;用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间
  -->
- <data>
-<!--  商品数据内容
  -->
- <display>
<data_id>1233433</data_id>
- <!-- 必填;商品唯一id,最大150个字符,eg:淘宝:id=12539493846 -->

  <title>ThinkPad SL410(2842-EWC)14.0英寸笔记本电脑</title>
- <!--  必填;商品名称 最大150个字符
  -->
  <realtitle>ThinkPad SL410</realtitle>
- <!--  可选填;商品货号 最大50个字符
  -->
  <image>http://img10.360buyimg.com/S0/4086/0564dcd5-a1a6-4d97-9479-cec90186e065.jpg</image>
- <!--  必填;商品图片链接:<br>图片请尽量提供宽度在400px以上的。
  -->
  <moreimage>http://img10.360buyimg.com/S0/4086/0564dcd5-a1a6-4d97-9479-cec90186e065.jpg,http://img10.360buyimg.com/S0/4086/0564dcd5-a1a6-4d97-9479-cec90186e065.jpg,http://img10.360buyimg.com/S0/4086/0564dcd5-a1a6-4d97-9479-cec90186e065.jpg</moreimage>
- <!--  可选填;更多商品图片链接:<br>图片请尽量提供宽度在400px以上的,多个用","区分。
  -->
  <originprice>5200.00</originprice>
- <!--  可选填;商品原价:<br>保留小数点后两位
  -->
  <price>4999.00</price>
- <!--  必填;商品实际价格:<br>保留小数点后两位
  -->
  <brand>ThinkPad</brand>
- <!--  可选填;商品品牌:<br>当该品牌有中英文两种表示方法时,只要提交其中一个即可。请勿将中英文的品牌混杂在一起提交。否则无法识别准确。无法检索到。
  -->
  <cid>101,102</cid>
- <!--  必填;商品分类id:<br>多个id用","区分。
  -->
  <keywords>ThinkPad\笔记本电脑</keywords>
- <!--  必填:商品关键字有助于搜索<br>另:keywords词不得堆砌,需确保所填词能准确描述该商品。<br>不能超过5个,词间以"\"分隔。 最大150个字符
  -->
  <props>颜色:红色,白色;cpu:至强;屏幕:14寸;</props>
- <!--  可选填;属性项、属性值。不同属性项间以分号分隔,不同属性值间以逗号分隔。如:颜色:红色,白色;尺码:35,36,37;风格:日韩;款式:开衫。  最大150个字符
  -->
  <services>正规发票\全国联保\7天退换货</services>
- <!--  必填;购买此商品时获得的服务保障:<br>例1~3个6字以内的词,词间以"\"分隔。  最大100个字符
  -->
  <topay>0</topay>
- <!--  可选填;是否支持货到付款:<br>0不支持,1支持
  -->
  <replacement>7</replacement>
- <!--  可选填;支付支持退换货:<br>数字表示可支持退换货的天数,0为不支持
  -->
  <store>京东商城</store>
- <!--  必填;商家名  最大10个字符
  -->
  <stock>0</stock>
- <!--  必填;商品状态标记:<br>0表示正常;1表示缺货;2表示下架。
  -->
  <post_fee>0</post_fee>
- <!--  必填;是否包邮:<br>0表示不支持;1表示支持
  -->
  <description>SL410概述。The SL410 与上一代SL400系列相比,有了很大的变化:更轻的系统更薄的尺寸(新型的SL系列产品比过去的型号薄4mm,轻12%,意味着其具有更好的便携性),采用镜面屏,最佳尺寸的显示面板,强大的多媒体, 多点触摸技术, 更快的系统内存带来更好的用户体验。</description>
- <!--  可选填;商品描述:<br>以100字内为佳,不得包含html代码。
  -->
  <city>北京\上海\广州</city>
- <!--  可选填;商品所在地:<br>多个地址间以"\"隔开  最大50个字符
  -->
  <comments>150</comments>
- <!--  可选填;商品评论条数
  -->
  <commentsurl>http://club.360buy.com/review/199485-1-1.html</commentsurl>
- <!--  可选填;商品评论的链接
  -->
  <commentsnote>问号|2010-12-12 12:12:12|商品很不错。</commentsnote>
- <!--  可选填;商品评论的内容,多个评论请重复此字段   最大500个字符
  -->
  <expirationdate>2010-11-25</expirationdate>
- <!--  可选填;商品下架日期,日期格式为:yyyy-mm-dd
  -->
  <score>4\5</score>
- <!--   b2c商家需填写该商品真正评分,例如 5分\5分;pintrest商家填写该商品用户喜欢数量,例如 1000  
  -->
  <barcode>12312123132123</barcode>
- <!--  可选填;商品条形码  
  -->
  <mloc>http://m.baidu.com/3443.html</mloc>
- <!--  可选填;移动端描述商品详细信息页面URL地址,首尾勿带空格、不可见的换行符号
  -->
<jumploc>http://www.baidu.com/143321/</jumploc>
- <!-- pintreste商家必填,为商品购买跳转的url,例如 http://www.zhimei.com/outer/1396352,B2C网站无需填写,首尾勿带空格、不可见的换行符号
  -->
  </display>
- <!--  display字段为固定格式,必有
  -->
  </data>
  </url>

     常见问题
1、为什么做此次API格式升级?
首先,新格式减少了商家成本,只需商家按其自有类目及商品数据提交即可,分类和商品匹配由商品搜索技术完成。其次,新格式完善商品搜索类目体系,增加商家商品展现量。
对于商户优化分类和属性起到了很大作用,后台抓取也会比之前明显和精准,商品抓取精准,对用户搜索和流量的提升是一定的;

2、我的商品页的数据量很大(多于10MB),提交时需要注意什么?
每个文件最多可包含5000个url,并且文件在压缩前不得超过 10MB(10,485,760 字节)。如果超过10MB,必须将其分割成多个文本文件,并提供索引文件,索引文件格式如下:
 
<?xml version="1.0" encoding="utf-8" ?>
  <sitemapindex>
   <sitemap>
    <loc>http://www.shangpin.com/url1.xml</loc>
    <lastmod>2010-04-26</lastmod>
   </sitemap>
   <sitemap>
    <loc>http://www.shangpin.com/ url2.xml</loc>
    <lastmod>2010-04-26</lastmod>
   </sitemap>
  </sitemapindex>


3、我是老用户,请问新格式与老格式有什么区别?
为了商品资源有更多的展现维度,从而使商家资源有更多的展现机会,故对原API格式进行升级(具体字段见上表标红处),主要变化有:
(1)老API中:Tags字段为层级分类+关键字。新API中:取消Tags字段。商品分类信息通过填写cid字段完善。keywords为商品关键字,若有多个关键字描述该商品,则用“\”符号隔开。
(2)添加了更加丰富的商品维度,如“是否货到付款”等等
4、XML在格式方面是否有通用规范?
支持的编码格式为UTF-8和gbk,推荐使用utf-8编码。注意:XML文件头部的encoding
值必须与XML文件的实际编码类型一致。
另外,建议最好使用 gzip 压缩文件,否则不要压缩。
5、某些必选字段看起来必未展现,为何需要填写?
虽未展现,但是我们计算相关性和排序的重要依据。部分字段虽未在页面前端展现,但是我们用以协助进行资源筛选和检索结果排序的重要依据。
6、< score >商品评分 填写要求:
可选填,b2c商家需填写该商品真正评分,例如 5分\5分;
pintrest商家填写该商品用户喜欢数量,例如 1000;
建议填写,会影响优质资源的排序;
7、<jumploc>商品购买地址 填写要求:
     Pintreste商家必填,为商品购买跳转的url,例如 http://www.zhimei.com/outer/1396352;
B2C网站无需填写,首尾勿带空格、不可见的换行符号


8. < mloc >移动端属性 填写要求:
可选填;移动端描述商品详细信息页面URL地址,首尾勿带空格、不可见的换行符号;
建议商家有移动端必填写,会对无线商品搜索切入;


9、<data_id >填写要求:
必填项;如为淘宝客类网站,商品唯一id,如商品是淘宝的,就填写加了前缀的淘宝id,如:tb_12345;
其他商品填写商家自有id即可;


10、<expirationdate>商品下架日期 填写要求:
      可选填;商品下架日期,日期格式为:yyyy-mm-dd
      建议填写,会影响优质资源的展示和排序;如无此数据,建议删除此字段,不要为空;


11、请保证您提交的xml文件地址和文件包含URL的域名保持一致。


12、新API接口不可在旧接口上修改,需要重新开发新接口,请周知;

13、新API接口特别对于3C类目中:comments (评论数)、score (评分)、mloc(移动网页URL); 必须要填,这几个字段无线商品搜索都需要。



(责任编辑:admin)
标签:商品说明搜索百度文档API开放平台
上一篇:重要提醒:请最近升级了ShopEx安全补丁的朋友联系本站客服进行插件的同步更新升级! 下一篇:升级通知:shopex一淘(etao)整合商品收录feed接口更新V1.8,请联系客服!