搜索
查看: 22660|回复: 25

【啊哈!算法】算法1:最快最简单的排序——桶排序

[复制链接]
发表于 2014-2-23 11:30:28 | 显示全部楼层 |阅读模式
《啊哈C》出版之后,很多网友希望能够有加深的内容,比如数据结构、算法之类的。今后每周五更新一篇吧。

最快最简单的排序——桶排序

  在我们生活的这个世界中到处都是被排序过的。站队的时候会按照身高排序,考试的名次需要按照分数排序,网上购物的时候会按照价格排序,电子邮箱中的邮件按照时间排序……总之很多东西都需要排序,可以说排序是无处不在。现在我们举个具体的例子来介绍一下排序算法。
图片1.png

  首先出场的我们的主人公小哼,上面这个可爱的娃就是啦。期末考试完了老师要将同学们的分数按照从高到低排序。小哼的班上只有5个同学,这5个同学分别考了5分、3分、5分、2分和8分,哎考的真是惨不忍睹(满分是10分)。接下来将分数进行从大到小排序,排序后是8 5 5 3 2。你有没有什么好方法编写一段程序,让计算机随机读入5个数然后将这5个数从大到小输出?请先想一想,至少想15分钟再往下看吧(*^__^*) 。
图片2.png

  我们这里只需借助一个一维数组就可以解决这个问题。请确定你真的仔细想过再往下看哦。
  首先我们需要申请一个大小为11的数组int a[11]。OK现在你已经有了11个变量,编号从a[0]~a[10]。刚开始的时候,我们将a[0]~a[10]都初始化为0,表示这些分数还都没有人得过。例如a[0]等于0就表示目前还没有人得过0分,同理a[1]等于0就表示目前还没有人得过1分……a[10]等于0就表示目前还没有人得过10分。
图片3.png

  下面开始处理每一个人的分数,第一个人的分数是5分,我们就将相对应a[5]的值在原来的基础增加1,即将a[5]的值从0改为1,表示5分出现过了一次。
图片4.png

  第二个人的分数是3分,我们就把相对应a[3]的值在原来的基础上增加1,即将a[3]的值从0改为1,表示3分出现过了一次。
图片5.png

  注意啦!第三个人的分数也是“5分”,所以a[5]的值需要在此基础上再增加1,即将a[5]的值从1改为2。表示5分出现过了两次。
图片6.png

  按照刚才的方法处理第四个和第五个人的分数。最终结果就是下面这个图啦。
图片7.png

  你发现没有,a[0]~a[10]中的数值其实就是0分到10分每个分数出现的次数。接下来,我们只需要将出现过的分数打印出来就可以了,出现几次就打印几次,具体如下。
  a[0]为0,表示“0”没有出现过,不打印。
  a[1]为0,表示“1”没有出现过,不打印。
  a[2]为1,表示“2”出现过1次,打印2。
  a[3]为1,表示“3”出现过1次,打印3。
  a[4]为0,表示“4”没有出现过,不打印。
  a[5]为2,表示“5”出现过2次,打印5 5。
  a[6]为0,表示“6”没有出现过,不打印。
  a[7]为0,表示“7”没有出现过,不打印。
  a[8]为1,表示“8”出现过1次,打印8。
  a[9]为0,表示“9”没有出现过,不打印。
  a[10]为0,表示“10”没有出现过,不打印。
  最终屏幕输出“2 3 5 5 8”,完整的代码如下。

  1. #include <stdio.h>
  2. int main()
  3. {
  4.     int a[11],i,j,t;
  5.     for(i=0;i<=10;i++)
  6.         a[i]=0;  //初始化为0
  7.    
  8.     for(i=1;i<=5;i++)  //循环读入5个数
  9.     {
  10.         scanf("%d",&t);  //把每一个数读到变量t中
  11.         a[t]++;  //进行计数
  12.     }

  13.     for(i=0;i<=10;i++)  //依次判断a[0]~a[10]
  14.         for(j=1;j<=a[i];j++)  //出现了几次就打印几次
  15.             printf("%d ",i);

  16.     getchar();getchar();
  17.     //这里的getchar();用来暂停程序,以便查看程序输出的内容
  18.     //也可以用system("pause");等来代替
  19.     return 0;
  20. }
复制代码
输入数据为
  1. 5 3 5 2 8
复制代码
仔细观察的同学会发现,刚才实现的是从小到大排序。但是我们要求是从大到小排序,这该怎么办呢?还是先自己想一想再往下看哦。

  其实很简单。只需要将for(i=0;i<=10;i++)改为for(i=10;i>=0;i--)就OK啦,快去试一试吧。

  这种排序方法我们暂且叫他“桶排序”。因为其实真正的桶排序要比这个复杂一些,以后再详细讨论,目前此算法已经能够满足我们的需求了。

  这个算法就好比有11个桶,编号从0~10。每出现一个数,就将对应编号的桶中的放一个小旗子,最后只要数数每个桶中有几个小旗子就OK了。例如2号桶中有1个小旗子,表示2出现了一次;3号桶中有1个小旗子,表示3出现了一次;5号桶中有2个小旗子,表示5出现了两次;8号桶中有1个小旗子,表示8出现了一次。
图片8.png

  现在你可以请尝试一下输入n个0~1000之间的整数,将他们从大到小排序。提醒一下如果需要对数据范围在0~1000之间的整数进行排序,我们需要1001个桶,来表示0~1000之间每一个数出现的次数,这一点一定要注意。另外此处的每一个桶的作用其实就是“标记”每个数出现的次数,因此我喜欢将之前的数组a换个更贴切的名字book(book这个单词有记录、标记的意思),代码实现如下。
  1. #include <stdio.h>
  2. int main()
  3. {
  4.     int book[1001],i,j,t,n;
  5.     for(i=0;i<=1000;i++)
  6.         book[i]=0;
  7.     scanf("%d",&n);//输入一个数n,表示接下来有n个数
  8.     for(i=1;i<=n;i++)//循环读入n个数,并进行桶排序
  9.     {
  10.         scanf("%d",&t);  //把每一个数读到变量t中
  11.         book[t]++;  //进行计数,对编号为t的桶放一个小旗子
  12.     }
  13.     for(i=1000;i>=0;i--)  //依次判断编号1000~0的桶
  14.         for(j=1;j<=book[i];j++)  //出现了几次就将桶的编号打印几次
  15.              printf("%d ",i);

  16.     getchar();getchar();
  17.     return 0;
  18. }
复制代码
  可以输入以下数据进行验证
  1. 10
  2. 8 100 50 22 15 6 1 1000 999 0
复制代码
  运行结果是
  1. 1000 999 100 50 22 15 8 6 1 0
复制代码
  最后来说下时间复杂度的问题。代码中第6行的循环一共循环了m次(m为桶的个数),第9行的代码循环了n次(n为待排序数的个数),第14和15行一共循环了m+n次。所以整个排序算法一共执行了m+n+m+n次。我们用大写字母O来表示时间复杂度,因此该算法的时间复杂度是O(m+n+m+n)即O(2*(m+n))。我们在说时间复杂度时候可以忽略较小的常数,最终桶排序的时间复杂度为O(m+n)。还有一点,在表示时间复杂度的时候,n和m通常用大写字母即O(M+N)。

  这是一个非常快的排序算法。桶排序从1956年就开始被使用,该算法的基本思想是由E.J.Issac和R.C.Singleton提出来。之前我有说过,其实这并不是真正的桶排序算法,真正的桶排序算法要比这个更加复杂。但是考虑到此处是算法讲解的第一篇,我想还是越简单易懂越好,真正的桶排序留在以后再聊吧。需要说明一点的是:我们目前学习的简化版桶排序算法其本质上还不能算是一个真正意义上的排序算法。为什么呢?例如遇到下面这个例子就没辙了。

  现在分别有5个人的名字和分数:huhu 5分、haha 3分、xixi 5分、hengheng 2分和gaoshou 8分。请按照分数从高到低,输出他们的名字。即应该输出gaoshou、huhu、xixi、haha、hengheng。发现问题了没有?如果使用我们刚才简化版的桶排序算法仅仅是把分数进行了排序。最终输出的也仅仅是分数,但没有对人本身进行排序。也就是说,我们现在并不知道排序后的分数原本对应着哪一个人!这该怎么办呢?不要着急请看下节——冒泡排序。


码字不容易啊,转载请标明出处^_^
【一周一算法】算法1:最快最简单的排序——桶排序
http://bbs.ahalei.com/thread-4399-1-1.html (出处: 啊哈磊_编程从这里起步)





发表于 2014-2-23 12:42:34 | 显示全部楼层
本帖最后由 超神级 于 2014-2-24 07:39 编辑

不错回头再看!...
//修正:把程序一些错误修改。磊哥太大意了!程序没自己测试下...
//为了体谅些新人把不易理解的地方添加了一些注释。
#include <stdio.h>
int main()
{
    int a[11],i,j,t;
    for(i=0;i<=10;i++)
        {
        a=0;  //初始化为0
    }
    for(i=1;i<=5;i++)  //循环读入5个数
    {
        scanf("%d",&t);  //把每一个数读到变量t中
       a[t]++;  //进行计数,
                //用户输入的值是数组下标如果你输入1吧a[1]里面的值依然是0,
    }           //a[1]++;就是把吧a[1]里面的值加1,用一句话把这代码用处概况就是
                //把当前数组里面储存的值加1;

    for(i=0;i<=10;i++)  //依次判断a[0]~a[10]。;
        for(j=1;j<=a;j++)  //出现了几次就打印几次
            printf("%d ",i);//先把此处再次理解a[t]++;
            //详细分析下:为什么能实现排序呢。
                        //为什么需要11个数组呢!因为他只可以对10一下排序再大了就没对应的数组下标了!
           //重点来了!把数组从大到小遍历for(i=0;i<=10;i++)
           //for(j=1;j<=a;j++)  因为a的值是跟据输入的(参考a[t]++;)可能是1可能是2
           //这句话是判断里面的a的值是几!把当前数组下标i输出几次!

    getchar();getchar();
    //这里的getchar();用来暂停程序,以便查看程序输出的内容
    //也可以用system("pause");等来代替
    return 0;
}
//输入数据为
//23558


发表于 2014-2-23 13:55:45 | 显示全部楼层
高级篇就要出炉啦,必须点32个赞~~~
发表于 2014-2-23 14:44:59 | 显示全部楼层
顶顶顶
发表于 2014-2-23 17:26:16 | 显示全部楼层
磊哥终于可以出算法书了!赞一个!
发表于 2014-2-23 18:28:37 | 显示全部楼层
需要说明一点的是:我们目前学习的简化版桶排序算法其本质上还不能算是一个真正意义上的排序算法。为什么呢?例如遇到下面这个例子就没辙了。

  现在分别有5个人的名字和分数:huhu 5分、haha 3分、xixi 5分、hengheng 2分和gaoshou 8分。请按照分数从高到低,输出他们的名字。即应该输出gaoshou、huhu、xixi、haha、hengheng。发现问题了没有?如果使用我们刚才简化版的桶排序算法仅仅是把分数进行了排序。最终输出的也仅仅是分数,但没有对人本身进行排序。


这里概念错误了
事实上这里就是对分数进行排序,而不是对“人本身”进行排序
包含不包含名字对 算法 本身是没关系的
这里可以说是没有实现最初的要求,说“不是真正意义上的排序算法”就没必要了,建议删掉这些
 楼主| 发表于 2014-2-23 18:51:53 | 显示全部楼层
rosynirvana 发表于 2014-2-23 18:28
这里概念错误了
事实上这里就是对分数进行排序,而不是对“人本身”进行排序
包含不包含名字对 算法  ...

其实这里也没对分数进行真正的排序,因为输出的其实是序号
发表于 2014-2-23 19:42:47 | 显示全部楼层
啊哈磊 发表于 2014-2-23 18:51
其实这里也没对分数进行真正的排序,因为输出的其实是序号

序号说的是?
 楼主| 发表于 2014-2-23 22:31:27 | 显示全部楼层

比如说huhu 5分、haha 3分、xixi 5分、hengheng 2分和gaoshou 8分
最后可以输出 8分 5分 5分 3分 2分,其实最后只留下这些分数是没有用的。已经失去了排序的意义了,我们其实关心的是人的排序。而不是分数的排序。我们希望得到的是  gaoshou  huhu xixi haha hengheng。
发表于 2014-2-23 23:19:23 | 显示全部楼层
本帖最后由 超神级 于 2014-2-24 07:36 编辑
  1. 话说你们真不地道...
  2. 修正:
  3. #include <stdio.h>
  4. int main()
  5. {
  6.     int a[11],i,j,t;
  7.     for(i=0;i<=10;i++)
  8.         {
  9.         a[i]=0;  //初始化为0
  10.     }
  11.     for(i=1;i<=5;i++)  //循环读入5个数
  12.     {
  13.         scanf("%d",&t);  //把每一个数读到变量t中
  14.        a[t]++;  //进行计数
  15.     }

  16.     for(i=0;i<=10;i++)  //依次判断a[0]~a[10]
  17.         for(j=1;j<=a[i];j++)  //出现了几次就打印几次
  18.             printf("%d ",i);

  19.     getchar();getchar();
  20.     //这里的getchar();用来暂停程序,以便查看程序输出的内容
  21.     //也可以用system("pause");等来代替
  22.     return 0;
  23. }
  24. 输入数据为
  25. 23558
复制代码

点评

已修改!  发表于 2014-2-24 00:48
发表于 2014-2-23 23:47:43 | 显示全部楼层
啊哈磊 发表于 2014-2-23 22:31
比如说huhu 5分、haha 3分、xixi 5分、hengheng 2分和gaoshou 8分
最后可以输出 8分 5分 5分 3分 2分, ...

那么我一开始理解的没错,麻烦再看看我上面的发言

或者说,我们要的是根据A的B属性进行排序,那么在算法层面上,是对B排序
具体要求输出A的哪个属性,这已经不是算法层面的问题了
发表于 2014-2-23 23:52:57 | 显示全部楼层

这里把0写成NULL是不合适的
NULL这个宏被创造出来的原因是用来表示它是一个指针,而不是一个整数
这里的语义显然是个整数
发表于 2014-2-24 00:40:55 | 显示全部楼层
rosynirvana 发表于 2014-2-23 23:52
这里把0写成NULL是不合适的
NULL这个宏被创造出来的原因是用来表示它是一个指针,而不是一个整数
这里 ...

嗯!...            习惯了....
发表于 2014-2-24 00:44:56 | 显示全部楼层
超神级 发表于 2014-2-24 00:40
嗯!...            习惯了....

干脆把NULL忘掉
C++里不受待见,打的字还多
发表于 2014-2-24 00:47:06 | 显示全部楼层
rosynirvana 发表于 2014-2-24 00:44
干脆把NULL忘掉
C++里不受待见,打的字还多

额!...恩恩
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

广播台
特别关注
快速回复 返回顶部 返回列表