WCM项目实施中,对发布出的外网站点,通常会提供检索功能,一般的检索实施方案为:在wcm数据库中创建视图,通过GateWay将数据同步到TRSServer,再利用TRSServer提供的接口,实现检索。
以前项目实施的都是对WCM文档的标题,正文,关键词等WCMDOCUMENT或者其他关联表的一些属性做检索,现在项目提出的新需求为,检索的范围不仅仅是标题,正文等字段,还需要基于附件做检索。即,附件的描述、附件本身的内容都应该支持检索。
针对此需求,在新版本的GateWay中已经可以将附件的内容抽取出来,存储到字段中,基于此版本的新功能,可以实现附件支持检索的功能。
WCM版本:适用于WCM任何版本
GateWay:GateWay的最新版本,目前还在测试阶段,实施时,可以找六部的付总要最新介质以及文档
在wcm中创建视图,创建视图的sql示例如下:
CREATE VIEW V_WCMDOCANDAPP as SELECT Doc.DocId,Doc.DocTitle, Doc.DOCKEYWORDS,Doc.DOCCHANNEL,Doc.SITEID,Doc.DOCPUBURL,Doc.DOCPUBTIME,Doc.CRTIME, App.AppFile,App.AppDesc FROM WCMDOCUMENT Doc,WCMAPPENDIX App WHERE Doc.DocId=App.AppDocId AND Doc.DocStatus=10 AND Doc.DocChannel>0 AND App.AppFlag=10
此步骤参考GateWay的用户手册。其中,需要注意的是:在设置主键的界面如下图,勾选“合并记录集中主表重复的非主表字段内容”和“排重合并记录集中的重复记录”
在字段映射的页面,选择大对象属性的时候,选择wcm的文件路径或者wcm文件路径+内容分析,这样就可以抽取wcm附件的内容了。此设置如下所示:
在网关客户端界面的菜单栏工具选项中,点击wcm变量设置,弹出对话框,如图所示:
其中变量名就是wcm文件名前缀,由于WCM中的文档附件上传后,都会上传到WCMDataprotect下,所以,变量名设置为PO,变量值就是wcm附件的路径,路径只填写到protect这一层即可,将需要抽取的附件的路径和文件名前缀对应填写到这个对话框中,然后确定,就会在网关服务端目录conf目录下,形成一个文件名为gw_wcm.conf的文件,其内容形式为P0=D:TRSTRSWCMV7WCMDataprotect。
在网关服务端的gw_wcm.conf文件内容也可以手动修改,当重启网关之后,就会加载,此时点击客户端工具菜单中的wcm变量设置,就会把文件中的内容显示在此对话框中。此对话框中的内容可以添加和删除操作。
其他步骤按照网关使用手册操作即可