Joslyn Lim, Developer in Kuala Lumpur Federal Territory of Kuala Lumpur, Malaysia
Joslyn is available for hire
Hire Joslyn

Joslyn Lim

验证专家  in 工程

数据开发人员

Location
Kuala Lumpur Federal Territory of Kuala Lumpur, Malaysia
至今成员总数
2022年9月28日

Joslyn is a seasoned data practitioner with demonstrated experience across multiple industries, including technology consulting and customer service. With her academic background in applied statistics and a skillset in machine learning, 数据分析, Python, and SQL, Joslyn has delivered numerous projects with positive business impacts on customers.

Portfolio

Dattel
Agile, 亚马逊机器学习, 亚马逊QuickSight, Flutter, .NET 3...
Kognitiv
Python 3, PostgreSQL, Tableau, Microsoft SQL Server, Bitbucket, Jira, FastAPI...
停止交通
亚马逊SageMaker, Python 3, PyTorch, Docker, IBM Cloud, MongoDB, 编程...

Experience

Availability

Part-time

首选的环境

Visual Studio Code (VS Code), Python 3, SQL

最神奇的...

...project I've worked on was building a data lake, 数据仓库, dashboards, and four machine learning use cases within 12 months with over 20 team members.

工作经验

首席技术官

2023年至今
Dattel
  • 领导一个使用GPT3的五人团队的广告文案和广告创意生成器的产品开发.5、稳定扩散. MVP在一个区域营销活动中展示,第一周就带来了大约100次使用.
  • 与GCR人员从零开始构建IT策略和数据治理框架,保护公司资产免受网络威胁.
  • Upgraded the development cycle for both the engineering and data teams to adopt a CI/CD practice, resulting in approximately 20% development time saved at the first stage.
Technologies: Agile, 亚马逊机器学习, 亚马逊QuickSight, Flutter, .. NET 3,软件架构,产品顾问,市场营销,数字广告,战略,OpenAI

数据科学经理

2023 - 2023
Kognitiv
  • Performed pre and post campaign analysis for both ATL and BTL campaigns using SQL, Python和R来了解活动的可行性和有效性,这些活动能够在非节日期间实现2-3%的平均提升.
  • 领导分析团队使用Python为区域客户进行数据和机器学习模型迁移的迁移和集成测试, SQL, and X-Ray, which saved the effort for up to 2 FTE (manual tester).
  • Advised both internal and external stakeholders on 数据分析 methodologies, 活动A/B测试, and technology architecture to achieve desirable outcomes.
技术:Python 3, PostgreSQL, Tableau, Microsoft SQL Server, Bitbucket, Jira, FastAPI, 单元测试, 数据迁移, SQL, 软件架构

数据科学家

2023 - 2023
停止交通
  • Conducted a user experience discovery workshop to identify user pain points and needs.
  • 开发了一个实体情感模型,利用迁移学习预测商业用户的文章情感.
  • 与客户和其他toptaler合作,使用IBM Cloud将机器学习模型投入生产.
技术:亚马逊SageMaker, Python 3, PyTorch, Docker, IBM Cloud, MongoDB, 编程, Scikit-learn, 大型语言模型(llm), OpenAI GPT-4 API, Modeling, 探索性数据分析, EDA, 非结构化数据分析, 电子表格, APIs, Amazon EC2

数据科学家 | 欧博体育app下载 Services

2023 - 2023
D3管理有限公司
  • 将第三方LMS数据集成到Sharepoint列表和PostgreSQL中,使用api生成洞察, 电力自动化, 和气流.
  • Built ETLs on premise core data to PostgreSQL using 电力自动化.
  • 为最终用户创建了Power BI仪表板,以加快获得洞察力和做出明智决策的时间.
技术:Microsoft Power BI, SharePoint, Apache气流, Microsoft Power automation, Heroku, PostgreSQL, 学习管理系统(LMS), BI报告, 集成, 编程, 数据清理, APIs, Amazon EC2, 软件架构

首席分析师

2021 - 2022
AXA Group
  • 将分析引入数字销售团队,为汽车政策部署留存机器学习模型, 数字销售仪表盘, and policy benefit package 优化, which improved the annual gross premium with a lower loss ratio.
  • Led the implementation of MLOps practice using AWS to monitor, track, maintain, 并改进现有的或正在生产的机器学习模型,将开发周期从6个月缩短到3个月,并提高透明度和可见性.
  • 与财务和精算团队合作,使用数据湖和报告工具(如SAP Webi)实施国际财务报告准则(IFRS) 17,为利益相关者提供及时和细致的见解.
  • Headed data literacy initiatives across the enterprise by curating learning programs, assessment, 辅导项目, hiring, retention, 各种参与活动将整体数据素养指数从33提升到50(总分100).
技术:Python 3, Redshift, SQL, AWS Glue, SAP商业智能(BI), Databases, GitHub, 微软流, Microsoft Power BI, SharePoint 365, Python, 数据分析, 亚马逊网络服务(AWS), 亚马逊机器学习, Amazon S3 (AWS S3), 项目管理, Analytics, 业务分析, ETL, Excel 365, SharePoint, Pandas, NumPy, 数据争吵, Jupiter, 机器学习操作(MLOps), 亚马逊SageMaker, 指示板, 商业智能(BI), 亚马逊QuickSight, 数据管道, 回归, 分类, Linux, XGBoost, 数据科学家, Reports, 数据报告, Cloud, AWS Fargate, Excel 2010, BI报告, 集成, 编程, Scikit-learn, Modeling, 探索性数据分析, EDA, 消费者的行为, 数据清理, 大数据集, 数据收集, Amazon EC2

数据科学经理

2019 - 2021
EY
  • Led, managed, and won more than $1 million in 数据分析 projects with the regional DnA team.
  • Headed and launched multiple analytics projects, 包括摩擦建模, 语言建模, 优化, 和仪表板, 2到10人的团队为社会和组织带来积极的经济影响.
  • 负责区域团队的人员管理,并负责建立和维持学习计划, events, and mentorship to support the team's continuous personal and career growth.
技术:Python 3, Spark ML, Spark SQL, Azure砖, Azure, Microsoft Power BI, Tableau, IT咨询, 敏捷项目管理, Ubuntu 16.04, R, Jupyter笔记本, Python, 数据分析, 数据可视化, 项目管理, Analytics, 业务分析, ETL, Pandas, NumPy, 数据争吵, Jupiter, 工程数据, 网页抓取, 指示板, 商业智能(BI), Big Data, 数据管道, 人工神经网络(ANN), 回归, 深度学习, 分类, 神经网络, Keras, Linux, XGBoost, 数据抓取, 数据科学家, Reports, Heatmaps, Cloud, 文本分类, Excel 2010, BI报告, 集成, 编程, 用户界面(UI), Scikit-learn, Modeling, 探索性数据分析, EDA, 数据清理, 大数据集, 非结构化数据分析, 数据收集, 电子表格, Azure机器学习, TensorFlow, APIs, Amazon EC2, BERT, 自定义伯特, 软件架构, Strategy, 大型语言模型(llm)

高级助理-数据科学

2018 - 2019
EY
  • 使用集成模型(XGBoost with Random Forests)为炼油厂开发了一种机器学习优化模型,估计可节省高达100美元,区域工厂.
  • 为一家公用事业公司创建了一个使用文本分析的社交倾听仪表板,通过对社交媒体平台上的负面情绪进行及时回应,提高数字声誉评分(DRS).
  • 使用迁移学习为智能城市原型构建了人脸识别和跟踪MVP,用于入侵者检测.
技术:Python 3, R, Brandwatch, Microsoft Power BI, RStudio, Python, 数据分析, 数据提取, Analytics, 业务分析, Pandas, NumPy, 数据争吵, Jupiter, 网页抓取, 指示板, 商业智能(BI), 人工神经网络(ANN), 回归, 深度学习, 分类, 神经网络, Keras, Linux, XGBoost, 数据抓取, 数据科学家, Reports, Heatmaps, Cloud, Excel 2010, BI报告, 编程, Scikit-learn, Modeling, 探索性数据分析, EDA, 数据清理, 数据收集, Amazon EC2

研究和分析主管

2016 - 2018
Dattel
  • 领导双向职能,用分析术语向跨业务线和职能领域的关键对手表达业务战略, 比如软件工程, marketing, etc., after a merger between True Vox Asia and Dattel.
  • Designed, managed, 并进行数据实验, 集合, 并在消费者智能平台上提供分析服务,作为中小型企业产品的一部分.
  • 管理多个项目, 包括客户细分, 品牌的宣传, 心理分析, and social-economic study publications to enable strategy formation for consumer brands to acquire, 吸引并留住他们的客户.
技术:Python 3, PostgreSQL, 敏捷项目管理, SQL, R, Git, 设计思考, Python, Analytics, Pandas, NumPy, 数据争吵, Jupiter, A / B测试, 产品开发, 回归, Linux, XGBoost, 数据科学家, Heatmaps, Excel 2010, 编程, Modeling, 探索性数据分析, EDA, 消费者的行为, 数据清理, 数据收集, 产品顾问, Marketing, 数字广告, Strategy

Motor Claim Part Price Prediction Model

基于机器学习回归模型的电机备件价格估算方法, accelerate the claim processing time, and systematize the part price assessment procedure. Collaborating with business users and the AWS team, 我从用户角色开始, 过程的理解, 头脑风暴会议. 该团队设计了一个解决方案,将机器学习与运行在AWS架构上的web应用程序结合起来,为不同汽车品牌和型号的备件推荐预测价格. The final model used was ensemble gradient boosted trees (GBT) regressors. 这一举措预计将提高客户满意度,因为它还缩短了索赔处理时间,减少了通货膨胀对备件成本的影响.

Customer Retention Model for Insurance Policies

一种分类机器学习模型,预测哪些政策可能会在即将到来的更新周期中停止. Regional retail general insurance has a very competitive landscape, so it is imperative to monitor a churn rate and keep existing customers whenever required. 开发团队与业务用户合作,了解在客户流失预测中有用的基本特性. As part of the data scientists team, I used past years' data to support the claims. The team built a random forest (RF) model to help end users retain the fence-sitters, i.e., indifferent customers and likely-to-churn customers, with incentives or targeted promotions.

Natural Language Processing and Modeling

The project was designed to predict the named entity, document sentiment and entity sentiment, locality, 和情感,准确度更高. In 2019-2020, Bert was state of the art (SoTA) for NLP. Still, it was not giving satisfying results for ASEAN languages (e.g., Indonesian, ASEAN Chinese, Malay, etc.) as the underlying models were using mostly US corpus. The team aimed to beat the SoTA for ASEAN languages. 从数据收集, curation, annotation, QA, 数据清理, 模型训练, evaluation, 和测试, the team of 10 was doing end-to-end delivery for our client. 我是其中一个语言支柱的所有者,同时也帮助其他语言支柱理解区域语言的上下文. 该团队进行了多次机器学习实验,发现变压器模型对一些语言语料库和它们的混合物效果最好, hence applying the large embedding to multiple language models. As the end deliverable, the team containerized the models and Python pipeline using Docker. The models were able to beat SoTA with around a 0.7 F1 score.

员工保留预测

一个区域外包和共享服务在过去一年经历了很高的员工流失率,希望减少人员流失, especially for the higher performer. 一个由五人组成的团队进行了定性和定量分析,以了解员工的痛点,并向客户提出了解决方案. I acted as a data scientist to conduct exploratory analytics using employee attendance and leave, 考核与绩效, 奖金和薪酬, and keyword extraction from interview sessions using Python, R, 和Power BI. 然后,将这些见解与流失数据相匹配,通过分类算法预测流失可能性,并总结(聚类和PCA)流失因素,以便客户能够优先考虑并针对影响较大的流失因素采取行动.
2014 - 2016

统计学硕士学位

University of Malaya - Kuala Lumpur, Malaysia

2008 - 2011

数学学士学位

University of Science, Malaysia - Penang, Malaysia

2023年3月- 2026年3月

AWS认证机器学习

AWS

2022年5月至今

Enterprise 设计思考 Co-creator

IBM

2021年12月至2024年1月

Power Platform Solution Architect Expert

Microsoft

2021年9月至2023年9月

Power Platform Functional Consultant Associate

Microsoft

2021年7月- 2023年7月

谷歌云 Certified Professional – 机器学习 Engineer

谷歌云

2021年7月- 2023年7月

GCP专业云架构师

GCP

2021年1月- 2024年1月

Azure人工智能工程师助理

Microsoft

2020年12月至2023年12月

Azure数据科学助理

Microsoft

2020年8月至2023年8月

Azure解决方案架构师

Microsoft

2019年11月至今

专业Scrum Master I

Scrum.org

库/ api

Pandas, NumPy, Keras, XGBoost, Scikit-learn, Spark ML, PyTorch, TensorFlow

Tools

Microsoft Power BI, 微软流, Tableau, Git, 亚马逊SageMaker, 电子表格, Azure机器学习, AWS Glue, GitHub, Spark SQL, Microsoft Power Apps, 命名实体识别(NER), 亚马逊QuickSight, AWS Fargate, Apache气流, Excel 2010, Bitbucket, Jira

Languages

Python 3, Python, SQL, R

Paradigms

敏捷项目管理, 数据科学, 商业智能(BI), 设计思考, Agile, ETL, 单元测试

Platforms

Azure, Jupyter笔记本, Microsoft Power automation, SharePoint 365, 亚马逊网络服务(AWS), Linux, Amazon EC2, 微软Power平台, Docker, Ubuntu, RStudio, SharePoint, 谷歌云平台(GCP), Visual Studio Code (VS Code), Heroku

Storage

PostgreSQL,数据库,Amazon S3, Redshift,数据管道,MongoDB, Microsoft SQL Server

行业专业知识

项目管理、市场推广

Frameworks

Flutter, .NET 3

Other

Ubuntu 16.04, 机器学习, 数据分析, Analytics, 数据争吵, Jupiter, 数据科学家, Modeling, 探索性数据分析, EDA, Statistics, SAP商业智能(BI), IT咨询, 自然语言处理(NLP), 数据分析, 数据可视化, 亚马逊机器学习, 业务分析, 指示板, Big Data, A / B测试, 产品开发, 人工神经网络(ANN), 回归, 深度学习, 分类, 神经网络, Reports, Heatmaps, 数据报告, Cloud, 文本分类, 编程, 消费者的行为, 数据清理, 大数据集, 非结构化数据分析, 数据收集, APIs, BERT, 自定义伯特, 软件架构, Azure砖, Scrum Master, 人工智能(AI), 解决方案设计, 解决方案架构, IT项目管理, 沟通, 根本原因分析, 情绪分析, 分类算法, 主成分分析(PCA), 多元统计建模, Brandwatch, 数据提取, 降低成本 & 优化, Excel 365, 工程数据, 语言模型, 机器学习操作(MLOps), 谷歌云 ML, 文本分析, 网页抓取, 数据抓取, GPT, Generative Pre-trained Transformers (GPT), 学习管理系统(LMS), IBM Cloud, BI报告, 集成, 用户界面(UI), 大型语言模型(llm), OpenAI GPT-4 API, FastAPI, 数据迁移, 产品顾问, 数字广告, Strategy, OpenAI, 变压器模型

有效的合作

如何使用Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

分享你的需求

Discuss your requirements and refine your scope in a call with a Toptal domain expert.
2

选择你的才能

Get a short list of expertly matched talent within 24 hours to review, interview, and choose from.
3

开始你的无风险人才试验

Work with your chosen talent on a trial basis for up to two weeks. Pay only if you decide to hire them.

对顶尖人才的需求很大.

开始招聘