博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
ClickStat业务
阅读量:6458 次
发布时间:2019-06-23

本文共 2711 字,大约阅读时间需要 9 分钟。

clickstat的源头:

#######################################

#       cn clickstat colletction      #
#######################################
     cnstatweb1 cnstatweb2
     cnstatweb3 cnstatweb4
     dw-uslogin

 

clickstat的文件存储:

for day in 19 20 21 22do    mkdir /home/admin/xuyuqin/1688_click/2011-08-$day    cp /mnt/nas1/cn-cookie/2011-08-$day/cnstat* /home/admin/xuyuqin/1688_click/2011-08-$day/done

 

日志举例:

 

clickstat日志底层逻辑:

SQL>

SELECT DISTINCT owner, table_name FROM ALL_TABLES WHERE table_name LIKE UPPER('%clickstat%') and owner = 'CNLOG';

OWNER                          TABLE_NAME

------------------------------ ------------------------------
CNLOG                          CLICKSTAT_URL_DIMT0
CNLOG                          CLICKSTAT_PROJECT_DIMT0
CNLOG                          CLICKSTAT_QUERY_DIMT0
CNLOG                          CLICKSTAT_FATDT0

 

col PROJECT_NAME for a20col CLICKSTAT_URL for a80col CLICKSTAT_QUERY_NAME for a20col CLICKSTAT_QUERY_DESC for a30SELECT /*+ PARALLEL(a,4) */    a.PROJECT_NAME,    b.CLICKSTAT_URL,    c.CLICKSTAT_QUERY_NAME,    c.CLICKSTAT_QUERY_DESC,    c.IS_USEFROM cnlog.CLICKSTAT_PROJECT_DIMT0 a,    cnlog.CLICKSTAT_URL_DIMT0 b,    cnlog.CLICKSTAT_QUERY_DIMT0 cwhere a.PROJECT_ID = b.PROJECT_ID  and b.CLICKSTAT_URL_ID = c.CLICKSTAT_URL_ID  and b.CLICKSTAT_URL like '%1688%';

 

clickstat的上层汇总逻辑:

方法一:在开发环境下grep

PT_dev_DB_Client 10.20.151.1

dwapp@pttest1:/home/dwapp>

grep "c02_clickstat_fatdt0" /home/dwapp/ccbu_rebuild/cn_product_task/bdl/*.pl

/home/dwapp/ccbu_rebuild/cn_product_task/bdl/exp_cn_click_attr.pl:      FROM    odl.c02_clickstat_fatdt0

/home/dwapp/ccbu_rebuild/cn_product_task/bdl/exp_cn_page_click.pl:              FROM    odl.c02_clickstat_fatdt0
/home/dwapp/ccbu_rebuild/cn_product_task/bdl/exp_cn_se_basic.pl:        FROM    odl.c02_clickstat_fatdt0 a
/home/dwapp/ccbu_rebuild/cn_product_task/bdl/exp_cn_se_filt_tmp.pl:     FROM    odl.c02_clickstat_fatdt0 
/home/dwapp/ccbu_rebuild/cn_product_task/bdl/exp_cn_se_filt_tmp.pl:     FROM    odl.c02_clickstat_fatdt0 
/home/dwapp/ccbu_rebuild/cn_product_task/bdl/exp_cn_se_filt_tmp.pl:     FROM    odl.c02_clickstat_fatdt0 
/home/dwapp/ccbu_rebuild/cn_product_task/bdl/exp_cn_se_filt_tmp.pl:     FROM    odl.c02_clickstat_fatdt0 
/home/dwapp/ccbu_rebuild/cn_product_task/bdl/exp_cn_se_filt_tmp.pl:     FROM    odl.c02_clickstat_fatdt0 

 

方法二:在windows下将SVN代码update后,搜索框:c02_clickstat_fatdt0 *.pl

查看后具体关注以下两个存储过程:

bdl.exp_cn_page_click.pl —— 将公共字段:stat_date ,click_id ,click_page_id ,cookie_id ,clickstat_url_id ,click_time ,refer_info ,dw_ins_date整合成为横表

bdl.exp_cn_click_attr.pl    ——各业务依然是纵表存放

odl.c02_clickstat_fatdt1    ——将日志的查询querystring单独存放,不用进行纵转横,方便处理

例如:select count(1) from odl.c02_clickstat_fatdt1 where yyyymmdd >= cast('20110817' as date) and yyyymmdd < cast('20110818' as date) and query_string like '%page=7%recId=1011%'

 

个性化推荐字段逻辑:

URL包含:

1688_click

page=7

recId=1011

转载于:https://www.cnblogs.com/include/archive/2011/08/23/2151043.html

你可能感兴趣的文章
华为设备VRRP+MSTP冗余负载均衡实现
查看>>
给表达式添加运算符
查看>>
oo总结
查看>>
bug管理工具之禅道的测试模块的使用
查看>>
CSS伪元素与伪类的区别
查看>>
电脑使用小技巧
查看>>
路径操作:Path
查看>>
[Asp.net]c#中的斜杠和反斜杠
查看>>
[bug] VS2013 Brower Link和Aspnetpager引发的问题分析
查看>>
聊天机器人语料批量处理-自动提取关键词并自动写入文件
查看>>
Cocos2dx 3.2键盘监听的打开方式以及点击两次返回退出的实现方法
查看>>
Spinner的简单实用
查看>>
字符串操作、文件操作,英文词频统计预处理
查看>>
你不得不知道的HTML5的新型标签
查看>>
雪崩效应解决办法
查看>>
java 封装返回json数据
查看>>
LeetCode 215: Kth Largest Element in an Array
查看>>
windows基于vs2017的opencv安装
查看>>
FluentAPI --- 用C#写的JS代码生成器
查看>>
《数据挖掘导论》实验课——实验七、数据挖掘之K-means聚类算法
查看>>