【小红书校招场景题】12306抢票系统

1 坐过高铁吧,有抢过票吗。你说说抢票系统对于后端开发人员而言会有哪些情况?

对于后端开发人员来说,开发和维护一个高铁抢票系统(如中国的12306)会面临一系列的挑战和情况。这些挑战主要涉及系统的性能、稳定性、数据一致性和用户体验。以下是一些具体情况和需要考虑的问题:

  1. 高并发处理

    • 高铁抢票系统特别是在节假日前后,会遭遇巨大的用户访问压力。系统需要能够处理成千上万的并发请求,这对服务器的处理能力和网络带宽提出了高要求。
    • 解决方案可能包括使用负载均衡、增加服务器数量、优化服务器和网络资源的使用等。
  2. 实时数据同步

    • 票务信息需要实时更新,确保用户看到的信息是最新的。任何票务数据的延迟或错误都可能导致用户购票失败。
    • 后端开发需要实现高效的数据同步机制,可能涉及消息队列、数据库事务、数据缓存等技术。
  3. 数据一致性

    • 在多个服务器和数据库之间保持数据一致性是一大挑战。例如,两个用户几乎同时抢同一张票时,系统必须确保票被正确地分配给其中一个用户,并及时反馈给另一个用户。
    • 可以通过分布式锁、数据库锁等技术来处理这类问题。
  4. 抗攻击能力

    • 抢票系统常常是攻击的目标,包括但不限于DDoS攻击和爬虫攻击。这些攻击可能会导致系统瘫痪。
    • 需要实施安全措施,如流量监控、IP黑名单、验证码等,来防止恶意攻击。
  5. 用户体验优化

    • 在高压和高期望的情况下,用户体验尤其重要。系统的响应时间、错误处理、用户界面的流畅性都直接影响用户的满意度。
    • 后端需要与前端紧密合作,优化接口设计,减少响应时间,提供清晰的错误信息和用户指导。
  6. 系统监控和故障恢复

    • 系统需要有强大的监控功能,能够实时检测性能瓶颈和潜在的故障点。
    • 同时,应有快速的故障恢复机制,包括数据备份、故障转移等,确保系统的高可用性。
  7. 合规性与隐私保护

    • 处理大量用户数据时,必须遵守相关的数据保护法律法规,保护用户的隐私。
    • 开发人员需确保所有个人数据的安全存储和传输,实现合规的数据访问和处理流程。

这些挑战要求后端开发人员不仅要有扎实的编程和系统设计能力,还需要对分布式系统、网络安全和数据库管理有深入的了解。同时,创新和持续优化也是维持系统长期运行的关键。

2 现在我们来给12306抢票系统设计一个缓存,kv存什么?

设计12306抢票系统的缓存主要是为了提高系统响应速度和减轻数据库的压力。在这种场景下,我们需要缓存的数据应该是那些访问频率高且相对稳定的信息。对于12306这样的火车票预订系统,以下是一些关键的数据类型,它们适合被存储在KV(键值)缓存中:

  1. 车次信息:包括车次号、起始站、终点站、经停站、发车时间、到达时间等。这些信息通常不会频繁变动,但会被频繁查询。

  2. 票价信息:各种车次的不同座位类型(如硬座、软座、硬卧、软卧等)的票价。这些信息变动频率也不高,但经常需要被访问。

  3. 余票信息:每趟车次的各种座位类型的剩余票数。这是抢票系统中变动最频繁、查询最多的数据,需要实时或近实时更新。

  4. 用户会话信息:用户的登录状态、会话token等信息,这有助于快速进行用户身份验证和状态保持。

  5. 常用乘车人信息:用户可能保存的快速预订常用乘车人的信息,包括姓名、身份证号等。

  6. 预订历史和状态:用户的订单历史和当前的订单状态,这有助于用户快速查询和修改订单。

  7. 动态调度信息:例如列车晚点、维修、变更等紧急信息,虽然不是常态数据,但在需要时,快速访问这些信息非常关键。

3 针对12306的票价、余票、用户会话、常用乘车人、预定历史和状态以及动态调度等信息,你该怎么设计缓存中的kv格式?

针对12306抢票系统中的不同信息类型(票价、余票、用户会话、常用乘车人、预订历史和状态、动态调度信息),我们可以设计一个有效的缓存键值(KV)格式,以确保数据快速读取和更新。下面我会为每种数据类型提出一个具体的KV格式设计方案:

1. 票价信息

键(Key)"TicketPrice:{train_number}:{travel_date}:{class_type}"

  • train_number:车次编号
  • travel_date:出行日期
  • class_type:座位等级,例如硬座、软座、硬卧等

值(Value):票价信息(数值)

2. 余票信息

"TicketAvailability:{train_number}:{travel_date}:{class_type}"

  • train_number:车次编号
  • travel_date:出行日期
  • class_type:座位等级

:剩余票数(数值)

3. 用户会话信息

"UserSession:{session_id}"

  • session_id:会话标识符

:用户的会话数据,如登录状态、最近活动等(JSON结构)

4. 常用乘车人信息

"FrequentTraveller:{user_id}"

  • user_id:用户ID

:用户的常用乘车人列表(JSON数组)

5. 预定历史和状态

"BookingHistory:{user_id}:{booking_id}"

  • user_id:用户ID
  • booking_id:预订编号

:预订的详细信息和状态(JSON结构)

6. 动态调度信息

"TrainStatus:{train_number}:{travel_date}"

  • train_number:车次编号
  • travel_date:出行日期

:列车的实时状态,如晚点、取消、变更路线等(JSON结构)

缓存设计注意事项:

  • 数据序列化:为了更高效地存储和检索复杂的数据结构(如JSON),需要选择合适的序列化和反序列化方法。
  • 缓存失效策略:对于频繁更新的数据(如余票信息和动态调度信息),采用较短的过期时间或基于事件的缓存失效机制。对于相对静态的数据(如票价信息),可以设置较长的过期时间。
  • 缓存同步:确保当基础数据库更新时,相关的缓存数据也同步更新,以避免数据不一致的问题。
  • 高可用性和容错性:在缓存系统设计中考虑使用多节点和数据复制策略,以提高系统的可用性和抵御单点故障的能力。

通过这种方式设计缓存,12306抢票系统可以实现数据的高效读取和更新,同时保持数据的一致性和系统的稳定性。

4 请把过期策略也讲一讲

在设计缓存系统时,合适的过期策略是至关重要的。这可以帮助保证数据的一致性,防止过时数据被访问,同时可以有效管理缓存资源,防止缓存占用过多的存储空间。针对12306抢票系统中不同类型的数据,我们可以采用以下几种过期策略:

1. 固定过期时间

对于那些变动不频繁且更新周期相对固定的数据,如票价信息,可以设置一个较长的固定过期时间。这种方式简单直接,易于管理。

示例

  • 票价信息:由于票价不经常变动,可以设置过期时间为24小时或更长,每天更新一次。

2. 基于事件的过期

当某些事件发生时,立即让相关缓存数据失效,这适用于那些更新频率高或需保持高实时性的数据。

示例

  • 余票信息:每当有票务交易发生(购票、退票等),立即使相关缓存失效,以保证余票信息的准确性。
  • 动态调度信息:如列车状态有变(如延误、取消),立即更新缓存。

3. 惰性过期

在这种策略下,过期的数据在缓存中保留,直到下一次访问时才检查其有效性。如果发现数据已过期,则进行更新。这种方式减少了系统的即时负担,但可能会导致偶尔的数据不一致。

示例

  • 常用乘车人信息:通常不急于更新这类信息,可以在用户再次访问时检查并更新。

4. 时间窗口过期

在某些场景下,数据仅在特定时间窗口内有效,过了这个时间窗口数据自然失效。

示例

  • 用户会话信息:会话信息(如登录状态)可以设置为几小时的过期时间,如设置为4小时,超过时间用户需要重新登录。

5. 缓存更新策略

除了过期策略,还需要有一套高效的缓存更新策略,以确保数据的及时更新。

示例

  • 在数据过期或即将过期时,后台可以预先加载新数据到缓存中,减少用户等待时间。
  • 使用后写(write-behind)策略,当数据更新时先写入缓存,然后异步更新到数据库。

通过上述不同的过期策略和更新策略的结合,可以为12306抢票系统提供一个既快速又准确的缓存解决方案,提升用户体验和系统性能。

5 12306抢票系统还有一个问题是,如果kv缓存中只存取余票信息,但是用户具体抢到了哪一个座位咋知道?

在12306这样的抢票系统中,如果KV缓存中仅用于存储余票数量,而不记录具体座位的信息,确实会遇到无法直接告知用户具体座位的问题。这种情况下,可以通过以下几种设计方法来解决这个问题:

1. 分离余票数量与座位分配

在这种设计中,缓存层主要负责存储和快速检索余票数量,而具体的座位分配则由后端系统在用户成功购票后处理。具体步骤如下:

  • 查询余票:用户查询特定车次的余票时,系统从缓存中获取信息。
  • 选择购票:用户决定购票后,系统先在缓存中扣减相应的余票数量。
  • 座位分配:系统再通过后端数据库确定具体可用的座位,并将这个信息返回给用户。
  • 数据同步:成功分配座位后,系统更新数据库中的座位信息,并同步到缓存中。

这种方法确保了系统处理的高速度和数据的一致性,尽管增加了处理步骤,但可以通过优化数据库操作和缓存同步策略来提高效率。

2. 座位地图缓存

如果系统需要让用户在选票时就能看到具体的座位,可以引入座位地图的缓存机制。这种方法可能涉及更复杂的缓存设计:

  • 座位地图:除了缓存余票数量外,还可以缓存一个座位地图,标示每个座位的占用情况。
  • 实时更新:每当座位被预订或释放时,即时更新座位地图的缓存。
  • 数据一致性:保证座位地图缓存与数据库中的座位信息同步,可以使用基于事件的缓存失效策略或定时同步。

3. 后端保留分配

在用户选择购票后,后端系统暂时保留余票,并在后台进行具体的座位分配:

  • 购票请求:用户发出购票请求时,系统仅检查并扣减余票数量。
  • 座位处理:在用户完成支付等后续步骤后,后端静默处理座位分配,并在所有步骤完成后一并返回座位信息。

这种设计可以在不牺牲用户体验的情况下,优化系统性能和响应时间。

结论

具体采用哪种方案取决于系统的业务需求、预期的用户体验和系统架构的复杂度。对于高并发系统,如12306抢票系统,通常需要在保证数据一致性、系统响应速度和操作简便性之间找到平衡点。

上一篇:numpy学习笔记(2),数组访问