查看原文
其他

2020大数据Java面试总结(未完待续)

The following article is from 数据爱好者社区 Author 感性企鹅


导读:纪录面试的经过,成功有经验,失败则有教训。目前已找到工作,做Java大数据,月base45k,整理总结,希望对你也有帮助。



自我介绍

  • 公司介绍,近期的三家公司,在线教育独角兽、暴风影音、创维数字

  • 负责的项目

  1. 面向业务的需求开发,亲子系统、支付系统、秒杀抽奖等

  2. 面向基础组件封装,springboot二次封装、分布式链路追踪系统apm、分布式任务系统等

  3. 面向推荐系统开发

  4. 面向团队建设,内部技术分享,包括java并发、基础组件应用、企业开发规范、推荐技术

为什么离职找工作

  • 现有系统已经很稳定了

  • 希望自己能进行更好的发展,不要让自己的技术停滞

  • 个人原因

秒杀系统介绍

  • 抽奖服务,注意奖品内存扣减

  • 抽奖服务,注意奖品池设计

秒杀系统

如何避免缓存雪崩

缓存雪崩分为两种:

  • 自然雪崩(缓存服务器宕机)

  • 非自然雪崩(缓存的key在同一时间过期)

解决方案:

  • 数据预热

  • 缓存高可用,异地多活

  • 限流降级

  • 在没有缓存的情况下加锁

redis版本

  • 阿里云版本2.8


redis应用,不仅仅是做一个kv缓存去用吧(介绍的时候千万不要拘泥于项目,一定要把redis的功能全部阐述出来)

  • 普通的缓存

  • 排行榜单

  • 分布式锁

  • 地图坐标,附近的人

  • 布隆过滤器(bitmap)

  • 网站uv统计(hyperloglog)

  • 订阅发布,可以做简易的聊天室(消息队列可以替代)

  • 实现分布式的乐观锁(watch+multi)

  • 支持事务操作(不支持原子性)

  • 计数器(incrby)

redis使用的客户端

  • jedis

  • redisTemplate

  • lettuce,通过大名鼎鼎的netty进行的实现,需要熟悉一下

redis的IO模型

  • NIO,异步IO

  • 底层是select+epoll做的实现

jvm

jvm参数配置

  • 场景1,测试环境一台机器带很多个微服务

出现过内存溢出的情况吗?怎么解决的?

  • 同事写的一个服务,在压测的时候出现了,开始的时候变慢,到最后出现oom的现象

spring

谈一下IOC和DI

  • 依赖反转(开发原则中的

    依赖导致原则

  • 自己之前搞过非IOC的项目

  • 所有的对象都是自己手动管理

  • 如果有一个对象跨模块使用,则需要在上层进行对象传递

  • 过程相当痛苦

  • 有了Spring的IOC,对象管理全部托管给spring

spring的bean被放在什么地方?

  • spring容器

  • spring容器是什么???

spring boot的启动过程

  • 初始化过程由SpringApplication类在承接

  • 推断应用类型,非web?web tomcat?或者web netty?

  • 启动所有初始化处理器Initializers,

  • 启动所有的监听器,监听器基本都是同步监听

  • 启动context

  • 启动环境相关

  • 使用所有的环境变量,这个其实不经常用

  • 启动SpringFactories的实例,都是利用AutoConfiguration的实例,也就是Springboot自动配置和零xml配置的核心,这里模仿了java的SPI机制,很多框架里面都有所使用。

  • 主要涉及的文件,resources/META-INF的spring.factories

需要强调

  • springboot设置了不同的事件监听器(例如Listener的starting、环境准备好、上下文准备好等事件),利用了观察者模式。

  • 启动过程最重要的是SpringFactoriesLoader进行自动配置的过程(此过程类似于java的spi机制,可以进行适度的发散)

微服务

你使用过的微服务架构

  • 主要使用springboot+dubbo

  • 需要了解spring cloud的架构

  • 需要了解grpc的架构

  • 对比微服务优缺点

服务治理是怎么实现的?

  • 基础的远程调用rpc

  • 通过实现负载均衡来实现高可用

  • 有容错机制,

    超时、重试、提供mock数据功能
  • 服务自动发现(只需要按照接口注册)

  • 性能日志监控(这里可以通过pinpoint去实现)

  • 服务治理中心,实现某节点的禁用(dubbo-admin)

dubbo的服务治理并优秀,主要还是使用的dubbo的高速rpc功能

在分布式系统中,你们的id是怎么处理的?(再次问,雪花算法怎么避免重复)

  • 雪花算法

参考:https://www.bilibili.com/video/BV1xK411W7zy?from=search&seid=5732540532182464777
发散回答:雪花算法+分表键选择了id+分表数量选择不规范,导致了数据集中的问题。

1.由于雪花算法中生成的id大多数都是0结尾,这和雪花算法本身有关系,“在同一个毫秒内,如果只生成一个id的话,那么sequence必然是0,最后的id生成也就是固定的0”。
2.在进行分库分表的时候,如果选择的不是质数,而是2的n次幂,更有甚者,选择“10”的话,那么数据将非常的集中,导致了分表后的数据倾斜。

消息队列

使用过哪些消息队列?

  • activateMq

  • rabitMq

  • rocketMq

  • kafka

说一下优劣

如何实现发现定时消息

自动集成

Jenkins

发散问题

你在公司偶尔做培训,那么你最近的一次培训是什么?

  • mapStruct插件的相关原理与应用

  • 分布式事务seta的简易实现

  • 阿里云机器学习pai简介

  • 简易爬虫的实现,实战爬取股票数据

  • 深度学习之人脸识别




欢迎点赞+收藏+转发朋友圈素质三连

看完本文有收获?请转发分享给更多人

大数据爱好者社区


文章不错?点个【在看】吧! 👇

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存