达芙妮·刘,美国佛罗里达州杰克逊维尔的开发商
Daphne is available for hire
Hire Daphne

Daphne Liu

Verified Expert  in Engineering

Data Modeling Developer

Location
Jacksonville, FL, United States
Toptal Member Since
June 18, 2020

Daphne是一位非常积极的大数据分析架构师和SQL/Tableau开发人员,拥有强大的业务分析解决方案交付技能和20年逐步负责OLTP/OLAP数据库开发/架构的经验. 她经常在商业智能和分析解决方案的研讨会上发言和研讨会培训师. Daphne在数据建模和业务分析解决方案方面与业务用户合作经验丰富.

Portfolio

CEVA Logistics
神经网络,性能调优,时间序列分析,时间序列...
City of Jacksonville
MDX, Microsoft SQL Server, SQL Server集成服务(SSIS), SSAS...
Crowley Marinetime
Subversion (SVN)、SQL Server报表服务(SSRS)、T-SQL (Transact-SQL)...

Experience

Availability

Part-time

Preferred Environment

亚马逊网络服务(AWS)、Azure、谷歌云、大数据、Linux、SQL

The most amazing...

...我是一个数据天才. 我是SQL开发专家, data modeling, data warehouse development, data analytics, and visualization.

Work Experience

Big Data ML AI Architect

2014 - PRESENT
CEVA Logistics
  • 在MS SQL Server上创建维度数据模型,用于供应链分析. 它包括数据准备和数据标注, model features' selection, model algorithms, and hyperparameter optimization.
  • 利用Pentaho PDI设计企业大数据分析平台解决方案, Cassandra, Elasticsearch, and Grafana. Grafana是一个大数据可视化工具.
  • 提供通过MS SQL Server将数据刷新到云存储的数据工程任务, 关系OLTP到OLAP的转换, 以及从MS SQL到NoSQL数据湖的ETL任务.
  • 为供应链管理和货运管理系统实现Tableau和Power BI分析可视化.
  • 实现并完成企业数据仓库的数据建模, data lakes, and ML/AI forecast models.
  • Used Facebook Prophet, a time series algorithms, AutoKeras classification, 谷歌TensorFlow为物流地面TMS系统提供ML和AI解决方案.
  • 使用Tableau和Power BI为不同的客户/项目提供仪表板.
  • 使用PostgreSQL模糊字符串匹配和Python的FuzzyWuzzy库提供了一个数据质量解决方案, cleaning data, 为机器学习模型创建映射组.
  • 设计并构建了一个供应链运营商顾问ML解决方案,其中包括数据标记, features' selection, hyperparameter optimization, algorithms training, 并为供应链管理团队提供明智的运营商选择建议.
  • 部署基于TensorFlow TF-Ranking的供应链运营商顾问ML模型, AutoKeras, and Neural Network algorithms. 这个模型训练了超过一百万条记录, 提供培训结果API和批量预测结果参考.
Technologies: 神经网络,性能调优,时间序列分析,时间序列, AutoKeras, Pandas, Python, Feature Selection, Data, Machine Learning, Data Architecture, OLAP, NoSQL, SQL, PostgreSQL, Microsoft SQL Server, Tableau, Hortonworks Data Platform (HDP), Grafana, Elasticsearch, Cassandra, Pentaho, Data Analysis, Big Data, Snowflake, Microsoft Excel, Amazon S3 (AWS S3), Database Design, Database Schema Design, Business Intelligence (BI), Integration, Amazon QuickSight

BI Architect

2013 - 2015
City of Jacksonville
  • 架构微软商业智能解决方案使用SQL Server, SSIS和SSAS.
  • Built SSAS Cube and MDX.
  • 开发SSIS,设计数据仓库.
  • 设计并开发了Microsoft Power BI解决方案.
Technologies: MDX, Microsoft SQL Server, SQL Server集成服务(SSIS), SSAS, Microsoft Power BI, Microsoft Excel, Amazon S3 (AWS S3), Database Design, Database Schema Design, Reporting, Business Intelligence (BI), Integration

BI Architect

2012 - 2013
Crowley Marinetime
  • 为预算和实际构建了微软商业智能解决方案SSAS Cube.
  • 从Oracle和DB2实现了一个SSIS ETL.
  • 创建了克劳利船长日志维度数据模型的TSQL.
  • Developed an SSRS report.
  • 实现SVN源版本控制.
Technologies: Subversion (SVN)、SQL Server报表服务(SSRS)、T-SQL (Transact-SQL), IBM Db2, Oracle, SQL Server集成服务(SSIS), SSAS, Microsoft Power BI, Microsoft Excel, Database Design, Database Schema Design, Reporting, Business Intelligence (BI), Integration

Tableau Dashboard Development

http://public.tableau.com/profile/daphne.liu#!/
供应链运营商KPI的表格仪表板设计, 财务管理KPI(应收与应收), 并能按时交货. Implemented Tableau actions, KPI calculated columns, LOD calculations, dynamic slicers, and performance tuning.

Big Data Cassandra & Solr Document Search

Solr云免费文本搜索引擎设计为厂商EDI文档使用Solr数据导入模块与Cassandra集群数据存储. 为Solr文档索引存储实现了Hadoop HDFS文件系统. 带有碎片和副本的六个Solr集合. Deployed in March 2016

Big Data Cassandra & Elasticsearch Data Warehouse

大数据NoSQL Cassandra和Elasticsearch集群解决方案设计与实现. Elasticsearch搜索引擎是建立在Cassandra集群之上的, 使用Pentaho PDI ETL工具将数据从关系数据库移动到Cassandra NoSQL集群,用于企业数据仓库. 2017年开工,2018年7月部署.

供应链管理与财务管理的多维数据模型

SCM和FM维度模型建立在当前SQL server数据存储之上. 这些模型为业务分析提供内部或外部客户数据源. 该解决方案采用TSQL、SSIS和SQL server 2016开发.

供应链运营商顾问-机器学习模型

Carrier Advisor是一个机器学习项目,为供应链管理系统中的运营商提供运营商建议.
我通过标记数据从OLAP构建了AI和ML模型, 选择特征和算法, POC using AutoML algorithms, 并使用AutoKeras和TensorFlow TF-Ranking进行最终的生产部署. 使用Python和Pentaho PDI将数据从OLAP转换为预测模型.

Languages

Python, T-SQL (Transact-SQL), SQL, Snowflake, Python 3, MDX

Libraries/APIs

熊猫,TensorFlow深度学习库(TFLearn)

Tools

AutoML, Tableau, Grafana, Pentaho数据集成(Kettle), Microsoft Excel, Amazon QuickSight, H2O AutoML, Apache Solr, Prophet ERP, Solr, Superset, Microsoft Power BI, SSAS, Subversion (SVN)

Paradigms

OLAP,数据库设计,商业智能,数据科学

Platforms

Dataiku, Linux, Amazon EC2, Azure, SolrCloud, Apache Kafka, Pentaho, Hortonworks Data Platform (HDP), Oracle, Amazon Web Services (AWS)

Storage

Microsoft SQL Server, OLTP, NoSQL, Elasticsearch, Amazon S3 (AWS S3), Redshift, Google Cloud, Cassandra, Druid.io, SQL Server集成服务(SSIS), IBM Db2, SQL Server报表服务(SSRS), PostgreSQL

Other

Data Analysis, Apache Cassandra, Big Data Architecture, Data Virtualization, Data Warehouse Design, Data Modeling, Data Architecture, Big Data, Forecasting, Time Series, AWS Database Migration Service, Database Schema Design, Integration, Data Engineering, Informatica, Artificial Intelligence (AI), Classification Algorithms, ARIMA Models, Machine Learning, Neural Networks, Agile Data Science, Linear Regression, Logistic Regression, Reporting, Feature Selection, AutoKeras, Performance Tuning, Classification, Data, Time Series Analysis

Frameworks

Hadoop, AWS HA

1993 - 1995

计算机信息科学硕士学位 & Engineering

University of Florida - Florida

MARCH 2014 - MARCH 2016

Tableau

Tableau