背景

在系统开发过程中，以迭代功能为主，在使用过程中遇到性能瓶颈再进行针对性优化。本次遇到的问题是在导入3000+FAQ时导入时间大概500S左右，用户端提示导入失败，结果数据在导入中。

文章出现的代码经过处理，不包含任何具体隐私信息，仅还原场景

概念：

FAQ：一般指常见问题解答。常见问题解答（frequently-asked questions，简称FAQ）即：一个问题对应一个答案。他的结构大概是一组相关的问题和一个答案。比如“你是谁？”这个问题，他会有不同的问法：“你叫什么？你叫啥？”，然后对应一个答案："我是xxx"
意图/Intent：即FAQ中的“你是谁”

目标

1、在3000条数据时，导入在时间优到5秒内（而用户能够忍受的最长等待时间在6～8秒之间）；
2、优化查询，返回时间在1S内；

步骤

1、找出瓶颈点；
2、确定优化措施；
3、实施；

这三个步骤看似简单，其实需要在开发过程中逐步积累出自己的套路及经验。

FAQ批量导入

这里从系统csv文件中读取出意图和答案，再将数据保存到数据库，然后做一些检查，把错误的信息打上标签。

解析数据
保存
校验、更新

找出瓶颈点

首先，我们发现API慢时，我们要知道哪些步骤慢。这里我们用到google的Stopwatch进行“打桩”，给个操作计时。

如

    public static void main(String[] args) {
        // 创建后可多次输出耗时
        Stopwatch stopwatch = Stopwatch.createStarted();
        ThreadUtil.sleep(1000);
        System.out.println("消耗时间：" + stopwatch.elapsed(TimeUnit.MILLISECONDS));
        ThreadUtil.sleep(2000);
        System.out.println("消耗时间：" + stopwatch.elapsed(TimeUnit.MILLISECONDS));
    }

消耗时间：1001
消耗时间：3009

回到我们的导入FAQ代码

   public void save(String faqId, MultipartFile file) throws Exception {
        Stopwatch stopwatch = Stopwatch.createStarted();
        // 1、从faq文件解析出数据
        List<List<String>> rows = _readRows(file);
        LOG.info("[import faq - finish check used:]", stopwatch.elapsed(TimeUnit.MILLISECONDS));

        // 获取一个链接
         Connection conn = getConn();

        // 一个FAQ由一个User、一个Bot组成
        // 转换成faq pair 对
        List<Pair<User, Bot>> details = _convertRows(rows, faqId);
        LOG.info("[import faq - convert: ]", stopwatch.elapsed(TimeUnit.MILLISECONDS));

        // 保存到数据库
        for (Pair<User, Bot> p : details) {
            ComponentDao.add(conn, p.getKey().toComponent());
            ComponentDao.add(conn, p.getRight().toComponent());
        }

        LOG.info("[import faq - save 2 db: ]", stopwatch.elapsed(TimeUnit.MILLISECONDS));
        conn.commit();

        LOG.info("[import faq - finish commit 2: ]", stopwatch.elapsed(TimeUnit.MILLISECONDS));
        _validate(faqId, conn);
        conn.commit();
    }

    private void _validate(String faqId, Connection conn, String dbName) throws Exception {
        Stopwatch stopwatch = Stopwatch.createStarted();
        // 1、创建一个上下文，携带一些信息
        ComponentValidatorContext context = _buildContext(componentId, conn);
        LOG.debug("[validate faq - build context:{}]", stopwatch.elapsed(TimeUnit.MILLISECONDS));

        // 2、 query 当前节点所在的validator，将user、bot转换成校验器
        Pair<ComponentValidator /*Faq Validator*/, List<ComponentValidator>/*children validators*/> validatorPair = _validators(context);
        LOG.debug("[validate faq - build validate pair:{}]", stopwatch.elapsed(TimeUnit.MILLISECONDS));

        // 3、遍历节点，更新错误信息
        LOG.debug("[validate faq - start validate with length:{}, spend:{}]", validators.size(), stopwatch.elapsed(TimeUnit.MILLISECONDS));
        int writeDbCount = 0;
        boolean hasError = false;
        for (ComponentValidator validator : validators) {
            StatusCodes statusCodes = validator.validate(context);
            if (statusCodes != null) {
                hasError = true;
            }

            // 节点错误
            boolean updated = updateComponentError(validator);
            if (updated) {
                ComponentDao.update(conn, validator.getComponent());
                writeDbCount++;
            }
        }

        LOG.debug("[validate faq - finish validate with write 2 db count:{}, spend:{}]", writeDbCount, stopwatch.elapsed(TimeUnit.MILLISECONDS));

        // 3、更新FAQ上的标记
        _updateError(faqId, hasError);
        LOG.debug("[validate used in millis:{}]", stopwatch.elapsed(TimeUnit.MILLISECONDS));
    }

运行结果

[import faq - finish check used:147]
[import faq - convert:241]
[import faq - finish save 2 db:50870]
[import faq - finish commit:50878]
[start validate]
[validate faq - build context:33486]
[validate faq - build validate pair:35203]
[validate faq - start validate with length:6795, spend:35203]
[validate faq - finish validate with write 2 db count:6795, spend:361809]
[validate used in millis:361818]

到此，我们可以从打桩信息中得出瓶颈：

保存到数据库，花费50s+
构建上下文：33s+
检验所有节点：326s+

确定优化措施

1、保存到数据库，花费50s+

代码：

        // 保存到数据库
        for (Pair<User, Bot> p : details) {
            ComponentDao.add(conn, p.getKey().toComponent());
            ComponentDao.add(conn, p.getRight().toComponent());
        }

这里有3397个FAQ，6794个User、Bot节点；那么就执行6794次save操作。

方案：结合以往经验，这里我们做批量保存。

减少db写入次数，批量写入;
mysql批量写入优化;

1、改为批量写入 : 写入db次数变成了 14次

private void _saveBach(List<Pair<RestProjectComponentUser, RestProjectComponentBot>> data,
                           Connection conn, String dbName)throws SQLException {
        String sql = "INSERT INTO tableName (id, xx, xx) VALUES (?, ?, ?) ";

        PreparedStatement ps = conn.prepareStatement(sql);

        for (int i = 0; i < data.size(); i++) {
            Pair<User, Bot> item = data.get(i);
            Component user = item.getKey().toComponent();
            Component bot = item.getValue().toComponent();

            _add2Bach(ps, user);
            _add2Bach(ps, bot);

            // 每500次提交一下
            if (i % 500 == 0) {
                ps.executeBatch();
                conn.commit();
                ps.clearBatch();
            }
        }

        ps.executeBatch();
        conn.commit();
        ps.clearBatch();
    }

    private void _add2Bach(PreparedStatement ps, Component component) throws SQLException{
        ps.setString(1, component.getId());
        ps.setString(2, component.getXX());
        ps.setString(3, component.getXx());
        ps.addBatch();
    }

2、mysql批量写入优化
修改链接信息，重写批量写入

jdbc:mysql://127.0.0.1:3305?rewriteBatchedStatements=true

验证

## 时间从50S+到1s+
[import faq - finish save 2 db:1586]

总结：这里原来每次保存都要写入数据库，大的数据量下这效率必然是低下的。经过批量保存和重写批量insert的sql，这减少了写入db次数，提高了sql批量写入效率

# 之前：6794次insert
insert into xx (xx,xx) values (xx,xx)

# 之后：14次批量insert 
INSERT INTO xx (xx,xx) values ('xxx','xxx'),('xxx','xxx')...

2、构建上下文：33s+

针对构建上下文，我们在再次打桩，查找瓶颈点

[build - context start build validate context]
[build - convert2Rest - start]
[build - convert2Rest - find root & query all projects spend:652]
[build - convert2Rest - load children:10113]
[build - convert2Rest - covert children:22067]
[build - build - context convert2Rest pair spend:22072]
[build - build - context spend:32382]

这里大概的逻辑：

查询顶级节点、查询当前项目下所有的节点信息
还原关联关系
从db对象转换成Rest对象
筛选一些节点

优化的点

多次查询当前项目的所有节点-这数据量大，多次重复操作
- 这在只查询一次，其他方法用到所有节点时通过参数传入
还原关联关系这用了递归，实现简单
- 数据量大时效率不如 while /for 循环 -- 改为while + for
从db对象转换成Rest对象-在循环中查询整个项目数据
- 减少重复查询db
- 循环中使用stream，筛选/转换少量 - 这种场景下效率不如for
筛选一些节点
- 减少db查询
- 递归转while /for

验证

[build - context start build validate context]
[build - convert2Rest - start]
[build - convert2Rest - find root & query all projects spend:3]
[build - convert2Rest - load children:15]
[build - convert2Rest - covert children:124]
[build - context convert2Rest pair spend:128]
[build - context spend:214]

总结：

减少db查询
合理使用stream
递归转while / for实现

这优化还是很明显，从32S+到0.2S。

3、检验所有节点：326s+

这是最耗时的地方，先分析下代码：

for循环所有节点，执行校验逻辑 - 验证意图（Intent，用户节点的输入需要唯一）不能重复
如果有错误，将错误信息更新并同步数据库

finish validate with write 2 db count:6795, spend:361809

这提示总共写了6795次db，这显然不合理，因为在测试的时候是全新的数据，不会重复。

        int writeDbCount = 0;
        boolean hasError = false;
        for (ComponentValidator validator : validators) {
            StatusCodes statusCodes = validator.validate(context);
            if (statusCodes != null) {
                hasError = true;
            }

            // 节点错误
            boolean updated = updateComponentError(validator);
            if (updated) {
                ComponentDao.update(conn, validator.getComponent());
                writeDbCount++;
            }
        }

这里结合上面的套路

优化stream
修复更新db的bug

finish validate with write 2 db count:0, spend:108427

这总时间从361s+到108s+,提升非常大。剩余的代码检查没有操作db，但仍然有如此高的耗时，这很不合理。

那么108427 / 6794 约等于16毫秒，校验一个节点需要这么久，显然不正常。
我们再次使用Stopwatch打点状，输出下校验的耗时

        for (ComponentValidator validator : validators) {
            Stopwatch sw = Stopwatch.createStarted();
            StatusCodes statusCodes = validator.validate(context);
            if (statusCodes != null) {
                hasError = true;
            }

            long usedInMillis = sw.elapsed(TimeUnit.MILLISECONDS);
            if (usedInMillis > 20) {
                LOG.debug("[validate usedInMillis:{}]", usedInMillis)
            }
            ....
        }

...
[validate component usedInMillis:199]
...

这就发现了问题，部分节点耗时异常的高。排查后发现这些节点的intent数量很大，intent越大越耗时。

    // 经过排查发现， 在校验User.Intent时会判断是否与数据库已存在的意图重复。
    // 那么这里有很大的计算量:
    // 这样判断扩展问重复从 example.size * db.example.size 
    private boolean intentRepeated() {
        List<String> exampleTexts = getIntents();

        //user的example不能重复，如果是引用的摸板则允许重复
        List<User> users = componets.stream()
                // filter
                .collect(Collectors.toList());

        for (User item : users) {
            List<String> examples =item.getIntents();
            for (String text : examples) {
                if (exampleTexts.contains(text)) {
                    return true;
                }
            }
        }

        return false;
    }

我们来看看这里的问题：

循环中有stream，这部分在筛选db中的User
- 这里所有节点都是一样的，不用每次都计算，将结果在context中缓存起来，只计算一次，后续直接用
for * for计算量大
- 修改实现

1、User从context获取，不在这进行计算 - 计算次数减少了6000次+

    List<User> users= null;
    public List<User> getUsers() {
        if (users == null) {
            synchronized (this) {
                if (users == null) {
                    users = componets.stream()
                            // ... filter
                            .collect(Collectors.toList());
                }
            }
        }

        return users;
    }

2、减少计算次数
这里需要一定的经验积累，比如在第二个for循环中，我们改成map.containsKey去判断，就去掉了一个for循环。

Tip：在最好的情况下，map.containsKey(key)的时间复杂度时o(1)
Context中构建db中存在的Intents,只在第一次用到时计算，其他后续节点直接使用即可；

   
 private boolean intentRepeated() {
       List<String> exampleTexts = getIntents();

       Map<String> exitsIntents = context.intentsMap();
       for (String text : examples) {
            if (exitsIntents.containsKey(text)) {
                    return true;
            }
       }

        return false;
    }

这样以来，我们的计算量变：从 example.size db.example.size 变成 example.size 1 次；

验证：

[start validate with length:6795]
[finish validate with write 2 db count:0, spend:227]

总结：

合理使用stream
缓存结果，减少计算次数
减少计算次数

结论

至此，完成了本次优化，同样数据导入时间控制在了5s左右。

减少db读写次数、批量操作；
合理使用stream，在循环且单个集合数量较小的情况下，使用循环；
合理使用递归
修复Bug
合适使用Context，将结果缓存，减少重复计算
减少计算量

经过此次调整，其中重要的是如何发现问题，解决方案可以有很多。同时要知道调整后，多少是符合预期的，不能盯着小的优化点去弄，这种优化空间太低了，反而会花很多时间效果也不会好。

如何找到瓶颈点
预期优化效果

在开发过程中，我们还是以满足实现为主，在时间可能的情况下合理保证代码效率，可以在后续碰到瓶颈时单独处理即可。

打个广告：

如果你是RASA开发者：

  PromptAI支持通过脑图的方式编辑对话流程，编辑完成后可一键下载Rasa Project文件，可在原生Rasa直接训练[部分高级功能需要配合应用使用] 

 - 功能: FAQ、多轮、变量提取（单个/多个）、form、webhook及自定义Action等高级功能；
 - 编辑: 支持拖拽、回收站、收藏、撤销、重做及复制等便捷功能；
 - 调试: 编辑完成后可一键调试、发布，最大程度减少开发时间。我们提供高性能GPU（3090），让你的效率起飞！
 - 其他: 支持私有部署，如果你有需求可联系我们！

如果你是普通用户，不会开发，但是想用AI对话：
  
 PromptAI对普通用户/企业极度友好，无需了解编程/AI的相关知识，也可快速上手，比Excel使用还简单，没有复杂繁琐的操作及公式！ 几分钟就能拥有自己的ChatBot！

免费使用：https://www.promptai.cn

注册过程：免费试用 -> 填写试用信息 -> 审核通过 -> 即可上手！

我是怎么样优化API的？

背景

概念：

目标

步骤