优化大文件下载性能需要根据实际场景选择合适的技术方案。对于大多数应用，流式传输已经能够满足需求；而对于视频网站、软件分发平台等需要处理超大文件的场景，实现断点续传会显著提升用户体验。同时，合理的限流和连接控制可以保证服务器的稳定运行。

传统下载方式的问题

大多数初级的文件下载实现存在以下问题：

内存消耗大：一次性将整个文件加载到内存
不支持断点续传：网络中断后需要重新下载
缺乏流量控制：可能耗尽服务器带宽
用户体验差：大文件下载时没有进度提示

解决方案一：流式传输

流式传输是优化大文件下载的基础方法，它通过分块读取和发送文件内容，显著降低内存使用：

@GetMapping("/download")
public void fileDownload(String id, HttpServletResponse response) {
    try {
        // 获取文件信息校验
        SysFiles file = filesService.selectSysFilesById(id);
        String filePath = getFilePath(file);
        File downloadFile = new File(filePath);
        
        // 设置响应头
        response.setContentType(MediaType.APPLICATION_OCTET_STREAM_VALUE);
        FileUtils.setAttachmentResponseHeader(response, file.getOriginName());
        response.setContentLengthLong(downloadFile.length());
        
        // 使用缓冲区流式传输
        try (InputStream is = new FileInputStream(downloadFile);
             OutputStream os = response.getOutputStream()) {
            byte[] buffer = new byte[4096]; // 4KB缓冲区
            int bytesRead;
            while ((bytesRead = is.read(buffer)) != -1) {
                os.write(buffer, 0, bytesRead);
            }
            os.flush();
        }
    } catch (Exception e) {
        log.error("下载文件失败", e);
    }
}

优点：

内存占用恒定（仅缓冲区大小）
立即开始传输，无需等待整个文件加载
适合大多数中小型文件下载场景

解决方案二：断点续传

对于超大文件或网络不稳定的环境，实现断点续传可以大幅提升用户体验：

@GetMapping("/download")
public void fileDownload(String id, HttpServletResponse response, HttpServletRequest request) {
    try {
        // 文件校验逻辑...
        
        long fileLength = downloadFile.length();
        long start = 0;
        long end = fileLength - 1;
        
        // 处理Range请求头
        String range = request.getHeader("Range");
        if (range != null && range.startsWith("bytes=")) {
            String[] ranges = range.substring(6).split("-");
            start = Long.parseLong(ranges[0]);
            if (ranges.length > 1) end = Long.parseLong(ranges[1]);
        }
        
        // 设置部分内容响应头
        response.setHeader("Content-Length", String.valueOf(end - start + 1));
        response.setHeader("Accept-Ranges", "bytes");
        if (range != null) {
            response.setStatus(HttpServletResponse.SC_PARTIAL_CONTENT);
            response.setHeader("Content-Range", 
                "bytes " + start + "-" + end + "/" + fileLength);
        }
        
        // 使用RandomAccessFile实现随机读取
        try (RandomAccessFile raf = new RandomAccessFile(downloadFile, "r");
             OutputStream os = response.getOutputStream()) {
            raf.seek(start);
            byte[] buffer = new byte[4096];
            long remaining = end - start + 1;
            
            while (remaining > 0) {
                int read = raf.read(buffer, 0, (int) Math.min(buffer.length, remaining));
                os.write(buffer, 0, read);
                remaining -= read;
            }
        }
    } catch (Exception e) {
        log.error("下载文件失败", e);
    }
}

优点：

支持网络中断后继续下载
客户端可以并行下载文件的不同部分
适合视频等大文件下载场景

其他优化建议

限流控制：使用Guava RateLimiter或自定义过滤器限制下载速度

RateLimiter limiter = RateLimiter.create(1024 * 1024); // 限制1MB/s
while ((bytesRead = is.read(buffer)) != -1) {
    limiter.acquire(bytesRead);
    os.write(buffer, 0, bytesRead);
}

NIO传输：对于超大文件，使用FileChannel可能更高效

FileChannel channel = new FileInputStream(file).getChannel();
channel.transferTo(0, channel.size(), Channels.newChannel(response.getOutputStream()));

超时控制：设置合理的下载超时时间

response.setHeader("Connection", "close");
response.setHeader("Timeout", "3600"); // 1小时超时

连接数限制：记录用户并发下载数

@GetMapping("/download")
@ConcurrentLimit(perUser = 3) // 自定义注解限制每个用户最多3个并发下载
public void downloadFile(...) { ... }

性能对比

方法	内存占用	网络中断恢复	实现复杂度	适用场景
传统方式	高	不支持	简单	小文件
流式传输	低	不支持	中等	中小文件
断点续传	低	支持	复杂	大文件

实现并发下载限制的自定义注解 `@ConcurrentLimit`

下面是一个完整的 @ConcurrentLimit 注解实现方案，用于限制用户并发下载数量：

1. 定义注解

import java.lang.annotation.*;

/**
 * 并发限制注解
 */
@Target(ElementType.METHOD)
@Retention(RetentionPolicy.RUNTIME)
@Documented
public @interface ConcurrentLimit {
    /**
     * 每个用户的最大并发数 (默认3)
     */
    int perUser() default 3;
    
    /**
     * 全局最大并发数 (默认100)
     */
    int global() default 100;
    
    /**
     * 被限制时的错误消息
     */
    String message() default "当前下载请求过多，请稍后再试";
}

2. 实现拦截器

import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;
import org.springframework.web.method.HandlerMethod;
import org.springframework.web.servlet.HandlerInterceptor;
import java.util.Map;
import java.util.concurrent.ConcurrentHashMap;
import java.util.concurrent.atomic.AtomicInteger;

public class ConcurrentLimitInterceptor implements HandlerInterceptor {
    
    // 用户级别的并发计数 (userId -> count)
    private final Map<String, AtomicInteger> userCounts = new ConcurrentHashMap<>();
    
    // 全局并发计数
    private final AtomicInteger globalCount = new AtomicInteger(0);
    
    @Override
    public boolean preHandle(HttpServletRequest request, HttpServletResponse response, Object handler) throws Exception {
        if (!(handler instanceof HandlerMethod)) {
            return true;
        }
        
        HandlerMethod handlerMethod = (HandlerMethod) handler;
        ConcurrentLimit limit = handlerMethod.getMethodAnnotation(ConcurrentLimit.class);
        if (limit == null) {
            return true;
        }
        
        // 检查全局限制
        if (globalCount.get() >= limit.global()) {
            response.sendError(HttpServletResponse.SC_SERVICE_UNAVAILABLE, limit.message());
            return false;
        }
        
        // 获取用户ID (根据你的认证系统调整)
        String userId = getUserId(request);
        if (userId != null) {
            AtomicInteger userCount = userCounts.computeIfAbsent(userId, k -> new AtomicInteger(0));
            if (userCount.get() >= limit.perUser()) {
                response.sendError(HttpServletResponse.SC_SERVICE_UNAVAILABLE, limit.message());
                return false;
            }
            userCount.incrementAndGet();
        }
        
        globalCount.incrementAndGet();
        return true;
    }
    
    @Override
    public void afterCompletion(HttpServletRequest request, HttpServletResponse response, 
                               Object handler, Exception ex) {
        if (!(handler instanceof HandlerMethod)) {
            return;
        }
        
        HandlerMethod handlerMethod = (HandlerMethod) handler;
        if (handlerMethod.getMethodAnnotation(ConcurrentLimit.class) == null) {
            return;
        }
        
        // 减少计数
        String userId = getUserId(request);
        if (userId != null) {
            AtomicInteger userCount = userCounts.get(userId);
            if (userCount != null) {
                userCount.decrementAndGet();
            }
        }
        
        globalCount.decrementAndGet();
    }
    
    private String getUserId(HttpServletRequest request) {
        // 根据你的认证系统获取用户ID
        // 例如: return (String) request.getAttribute("userId");
        // 或者从Spring Security中获取: 
        // Authentication authentication = SecurityContextHolder.getContext().getAuthentication();
        // return authentication != null ? authentication.getName() : null;
        return "default"; // 示例默认值
    }
}

3. 注册拦截器

import org.springframework.context.annotation.Configuration;
import org.springframework.web.servlet.config.annotation.InterceptorRegistry;
import org.springframework.web.servlet.config.annotation.WebMvcConfigurer;

@Configuration
public class WebConfig implements WebMvcConfigurer {
    
    @Override
    public void addInterceptors(InterceptorRegistry registry) {
        registry.addInterceptor(new ConcurrentLimitInterceptor())
                .addPathPatterns("/download");
    }
}

4. 使用示例

@GetMapping("/download")
@ConcurrentLimit(perUser = 2, global = 50, message = "您同时下载的文件过多，请完成当前下载后再试")
public void downloadFile(String id, HttpServletResponse response) {
    // 文件下载逻辑
}

5. 高级优化版本（带过期清理）

为了防止内存泄漏，可以添加定期清理不活跃用户的机制：

import java.util.concurrent.Executors;
import java.util.concurrent.TimeUnit;
import javax.annotation.PostConstruct;

public class ConcurrentLimitInterceptor implements HandlerInterceptor {
    
    // ... 其他代码同上 ...
    
    @PostConstruct
    public void init() {
        // 每30分钟清理一次不活跃用户(超过1小时)
        Executors.newSingleThreadScheduledExecutor().scheduleAtFixedRate(() -> {
            long now = System.currentTimeMillis();
            userCounts.entrySet().removeIf(entry -> {
                AtomicInteger count = entry.getValue();
                return count.get() == 0 && 
                       now - count.getLastAccessTime() > TimeUnit.HOURS.toMillis(1);
            });
        }, 30, 30, TimeUnit.MINUTES);
    }
    
    // 扩展AtomicInteger以记录最后访问时间
    private static class AccessAwareAtomicInteger extends AtomicInteger {
        private volatile long lastAccessTime = System.currentTimeMillis();
        
        @Override
        public int incrementAndGet() {
            lastAccessTime = System.currentTimeMillis();
            return super.incrementAndGet();
        }
        
        @Override
        public int decrementAndGet() {
            lastAccessTime = System.currentTimeMillis();
            return super.decrementAndGet();
        }
        
        public long getLastAccessTime() {
            return lastAccessTime;
        }
    }
    
    // 修改userCounts的初始化
    private final Map<String, AccessAwareAtomicInteger> userCounts = new ConcurrentHashMap<>();
    
    // 修改preHandle中的获取逻辑
    AccessAwareAtomicInteger userCount = userCounts.computeIfAbsent(
        userId, k -> new AccessAwareAtomicInteger());
}